一种egfr基因超低频突变检测试剂盒的制作方法

文档序号:10679997阅读:456来源:国知局
一种egfr基因超低频突变检测试剂盒的制作方法
【专利摘要】本发明公开了用于检测待测核酸样本目标区域的引物组合物及其应用,其中该引物组合物包括:第一通用引物和第二通用引物,所述第一通用引物和所述第二通用引物的靶点位于所述目标区域的两端,分别用于构成测序文库的5’端和3’端;以及特异性引物组,所述特异性引物组包括n条特异性引物,各特异性引物的结构相同,均是从5’端至3’端依次包括第一核酸序列、连接序列和第二核酸序列。该引物组合物能够有效地用于检测待测核酸样本目标区域的序列信息,尤其是超低频突变的检测,且检测灵敏度高,结果准确可靠。
【专利说明】
-种EGFR基因超低频突变检测试剂盒
技术领域
[0001] 本发明设及分子生物学领域,特别是突变检测技术领域,具体地,本发明设及一种 EGFR基因超低频突变检测试剂盒,更具体地设及用于检测待测核酸样本目标区域的引物组 合物及其应用。
【背景技术】
[0002] 已知,疾病相关的基因及致病突变位点的检测,对于深入的遗传学和病理学研究 W及疾病治疗的用药和耐药性等研究,均有重要意义。
[0003] 然而,目前的基因突变的检测方法或者灵敏度较低,或者通量较低,无法满足多样 本同时检测的需求。
[0004] 因此,目前急需一种高通量、检测灵敏度高的基因突变检测手段。

【发明内容】

[0005] 本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的 在于提出一种高通量、检测灵敏度高的基因突变检测手段。
[0006] 需要说明的是,本发明是基于发明人的下列发现而完成的:
[0007] 肺癌是世界上最常见的恶性肿瘤之一。非小细胞肺癌(non-small cell lung cancer,NS化C)约占所有肺癌的80%,约75%的患者发现时已处于中晚期,5年生存率很低。 研究表明,非小细胞肺癌人群中有40%患者携带表皮生长因子受体化GFR)基因的体细胞突 变。目前祀向治疗成为非小细胞肺癌临床治疗的重要手段。而在祀向治疗中,EGFR基因的运 些突变起到至关重要的作用。目前已开发出了吉非替尼(gef it inib)和厄洛替尼 (erlotinib)等表皮生长因子受体酪氨酸酶抑制剂(邱idermal growth factor receptor tyrosine kinases inhibitor EGFR-TKI)勒1向药物。患者个体EGFR基因的突变状态和运些 祀向药物的疗效密切相关。因此确定患者是否携带有相关EGFR基因突变在一定程度上可W 避免无效用药和解决耐药性等方面的问题。
[0008] EGFR是表皮生长因子化GF)细胞增殖和信号传导的受体。它是一种位于细胞膜表 面的跨膜受体酪氨酸激酶,分子量170邸a"EGFR与肿瘤细胞的增殖、血管生成、肿瘤侵袭、转 移及细胞调亡的抑制有关。EGFR由EGFR基因表达。EGFR基因位于7号染色体上,长约118肺, 包含28个外显子。其酪氨酸激酶功能区由18-24号外显子编码。研究发现NS化C患者的EGFR 基因突变主要发生在18-21号外显子上。主要突变类型包括18号外显子上的点突变 (G719X),19号外显子上的缺失突变(主要位于747-750位氨基酸),20号外显子上的插入突 变,20号外显子上的耐药点突变,21号外显子上的点突变化858R和L861Q)等。
[0009] 目前,针对EGFR基因突变的检测方法主要有直接测序法、等位基因特异性PCR法 (ARMS法)、数字微滴PCR法等。1)直接测序法一直W来被认为是检测基因突变的金标准。但 该法有两大缺点:一是灵敏度较低,一般需要突变基因丰度达到20% W上才能较准确检测。 因此只能检测肿瘤细胞占多数的肿瘤组织。对于取样方便的肿瘤患者血清/血浆样本,其肿 瘤特异性突变的DM比例往往低于1%,该法则完全无法检出。二是传统的Sanger测序法通 量较低,无法满足多样本同时检测的需求。2)等位基因特异性PCR法(ARMS法),该方法主要 用于对已知突变基因进行检测。利用PCR引物的3'端末位碱基必须与其DNA模板互补才能有 效扩增的原理,设计两个5 '端PCR引物,一个与正常DNA互补,一个与突变DNA互补。对于纯合 突变,分别加入运两种引物及下游3'端引物进行两个平行PCR。只有与突变DNA完全互补的 引物才能延伸进行PCR扩增。如果上游5 '端引物末端有错配,贝化CR无法延伸。因此运种方法 可W选择性扩增突变型DNA模板。该方法能够达到1%的灵敏度,但显然仍不足W对血浆、血 清等易取样本进行检测。同时也无法实现多样本高通量检测。3)数字微滴PCR的核屯、理念是 将传统PCR的反应体系进行细分,从而提升检测灵敏度。但目前报到的该方法检测EGFR基因 突变位点相对有限,仍处在摸索、积累经验的阶段。该方法对操作人员和环境均有较高的要 求,未来应用于临床尚需要大规模临床数据验证。
[0010] 因此,目前迫切需要一种高通量、检测灵敏度高的EGFR基因突变检测方法。
[0011] 进而,发明人经过一系列的研究,意外发现了一种高通量、检测灵敏度高的基因突 变检测手段,其不仅能够用于EGFR基因突变的检测,同样适用于其他基因的目标区域检测, 运些目标区域包含选自点突变、插入、缺失、基因融合突变的至少之一,尤其是超低频突变 的检测。
[0012] 从而,在本发明的第一方面,本发明提供了一种用于检测待测核酸样本目标区域 的引物组合物。根据本发明的实施例,该引物组合物包括:
[0013] 第一通用引物和第二通用引物,所述第一通用引物和所述第二通用引物的祀点位 于所述目标区域的两端,分别用于构成测序文库的5 '端和3 '端;W及
[0014] 特异性引物组,所述特异性引物组包括n条特异性引物,各特异性引物的结构相 同,均是从5 '端至3 '端依次包括第一核酸序列、连接序列和第二核酸序列,
[0015] 其中,各特异性引物均满足下列条件:
[0016] (1)各特异性引物的祀点,均是与所述第一通用引物的祀点分别位于所述目标区 域的两端,而与所述第二通用引物的祀点位于所述目标区域的同端;
[0017] (2)所述第一核酸序列和所述第二核酸序列对应的基因组位置位于所述目标区域 的同端;
[0018] (3)所述第一核酸序列对应的基因组位置与所述目标区域之间的距离,大于所述 第二核酸序列对应的基因组位置与所述目标区域之间的距离;
[0019] (3)所述第一核酸序列和所述第二核酸序列在对应的基因组位置上是连续的,但 无碱基重合;
[0020] (4)所述第一核酸序列的5'端第一个碱基距离目标区域不超过待测核酸样本的碱 基长度;
[0021] (5)所述连接序列由所述第二通用引物的3'端末的24个碱基构成;
[0022] (6)n= 1-5的任意整数,Wn = 5为例,设所述特异性引物组的各特异性引物分别 为:Nl、N2、N3、N4、N5,W特异性引物的祀点与目标区域之间的距离为衡量标准,各特异性引物 之间的距离远近关系为:
[0023] 化〉化〉化〉N4〉化。
[0024] 发明人惊奇地发现,本发明的引物组合物能够有效地用于检测待测核酸样本目标 区域的序列信息,尤其是超低频突变的检测。具体地,利用本发明的引物组合物,能够有效 地通过PCR扩增富集所述待测核酸样本目标区域的序列,进而进行建库、测序,从而能够有 效确定待测核酸样本目标区域序列信息,包括目标区域中所包含的点突变、插入、缺失或基 因融合突变,并且检测灵敏度高,结果准确可靠。
[0025] 在本发明的第二方面,本发明提供了一种试剂盒。根据本发明的实施例,该试剂盒 包含前面所述的引物组合物。根据本发明的实施例,本发明的试剂盒能够有效地用于检测 待测核酸样本目标区域的序列信息,尤其是超低频突变的检测。具体地,利用该试剂盒中的 引物组合物,能够有效地通过PCR扩增富集所述待测核酸样本目标区域的序列,进而进行建 库、测序,从而能够有效确定待测核酸样本目标区域序列信息,包括目标区域中所包含的点 突变、插入、缺失或基因融合突变,并且检测灵敏度高,结果准确可靠。
[0026] 在本发明的第=方面,本发明提供了一种构建待测核酸样本的目标区域检测文库 的方法。根据本发明的实施例,该方法利用前面所述的引物组合物或试剂盒,通过PCR扩增 富集所述待测核酸样本目标区域的序列。
[0027] 由此,能够有效地基于前述的本发明的引物组合物或试剂盒进行建库,进而能够 有效地用于测序,W确定待测核酸样本目标区域序列信息,包括目标区域中所包含的点突 变、插入、缺失或基因融合突变,并且检测灵敏度高,结果准确可靠,尤其适用于超低频突变 的检测。
[0028] 在本发明的第四方面,本发明提供了一种确定待测核酸样本目标区域序列信息的 方法。根据本发明的实施例,该方法包括:
[0029] 根据前面所述的构建待测核酸样本的目标区域检测文库的方法,构建所述待测核 酸样本的目标区域检测文库;
[0030] 对所述待测核酸样本的目标区域检测文库进行测序,W便获得测序结果;W及 [0031 ]基于所述测序结果,确定所述待测核酸样本目标区域的序列信息。
[0032] 发明人发现,利用该方法能够有效地基于前述的本发明的引物组合物或试剂盒构 建目标区域的测序文库和测序,从而能够有效确定待测核酸样本目标区域序列信息,包括 目标区域中所包含的点突变、插入、缺失或基因融合突变,并且检测灵敏度高,结果准确可 靠,尤其适用于超低频突变的检测。
[0033] 在本发明的第五方面,本发明提供了一种构建待测核酸样本目标区域检测文库的 装置。根据本发明的实施例,该装置设置有前面所述的引物组合物,所述装置适于利用特异 性引物组、第一通用引物和第二通用引物的混合物对所述待测核酸样本进行第一 PCR扩增, W便获得第一 PCR扩增产物,其中所述第一 PCR扩增产物构成所述待测核酸样本的目标区域 检测文库。
[0034] 由此,利用该装置能够有效地基于前述的本发明的引物组合物或试剂盒进行建 库,进而能够有效地用于测序,W确定待测核酸样本目标区域序列信息,包括目标区域中所 包含的点突变、插入、缺失或基因融合突变,并且检测灵敏度高,结果准确可靠,尤其适用于 超低频突变的检测。
[0035] 在本发明的第六方面,本发明提供了一种确定待测核酸样本目标区域序列信息的 系统。根据本发明的实施例,该系统包括:
[0036] 前面所述的构建待测核酸样本目标区域检测文库的装置,用于构建所述待测核酸 样本的目标区域检测文库;
[0037] 测序装置,所述测序装置与所述构建待测核酸样本目标区域检测文库的装置相 连,用于对所述待测核酸样本的目标区域检测文库进行测序,W便获得测序结果;W及
[0038] 序列确定装置,所述序列确定装置与所述测序装置相连,用于基于所述测序结果, 确定所述待测核酸样本目标区域的序列信息。
[0039] 发明人发现,利用该系统能够有效地基于前述的本发明的引物组合物或试剂盒构 建目标区域的测序文库和测序,从而能够有效确定待测核酸样本目标区域序列信息,包括 目标区域中所包含的点突变、插入、缺失或基因融合突变,并且检测灵敏度高,结果准确可 靠,尤其适用于超低频突变的检测。
[0040] 本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[0041] 本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得 明显和容易理解,其中:
[0042] 图1显示了实施例1中预文库扩增的PCR产物的电泳检测结果;
[0043] 图2显示了实施例1中递进式目标区域富集后纯化产物的电泳检测结果;
[0044] 图3显示了实施例2中预文库扩增的PCR产物的电泳检测结果;
[0045] 图4显示了实施例2中递进式目标区域富集后纯化产物的电泳检测结果;
[0046] 图5显示了根据本发明实施例的目标区域特异性引物的结构示意图;W及
[0047] 图6显示了根据本发明实施例的确定待测核酸样本目标区域序列信息的系统的结 构示意图。
【具体实施方式】
[0048] 下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发 明,而不能理解为对本发明的限制。
[0049] 在本发明的第一方面,本发明提供了一种用于检测待测核酸样本目标区域的引物 组合物。根据本发明的实施例,该引物组合物包括:
[0050] 第一通用引物和第二通用引物,所述第一通用引物和所述第二通用引物的祀点位 于所述目标区域的两端,分别用于构成测序文库的5 '端和3 '端;W及
[0051] 特异性引物组,所述特异性引物组包括n条特异性引物,各特异性引物的结构相 同,均是从5 '端至3 '端依次包括第一核酸序列、连接序列和第二核酸序列,
[0052] 其中,各特异性引物均满足下列条件:
[0053] (1)各特异性引物的祀点,均是与所述第一通用引物的祀点分别位于所述目标区 域的两端,而与所述第二通用引物的祀点位于所述目标区域的同端;
[0054] (2)所述第一核酸序列和所述第二核酸序列对应的基因组位置位于所述目标区域 的同端;
[0055] (3)所述第一核酸序列对应的基因组位置与所述目标区域之间的距离,大于所述 第二核酸序列对应的基因组位置与所述目标区域之间的距离;
[0056] (3)所述第一核酸序列和所述第二核酸序列在对应的基因组位置上是连续的,但 无碱基重合;
[0057] (4)所述第一核酸序列的5'端第一个碱基距离目标区域不超过待测核酸样本的碱 基长度;
[0058] (5)所述连接序列由所述第二通用引物的3'端末的24个碱基构成;
[0059] (6)n= 1-5的任意整数,Wn = 5为例,设所述特异性引物组的各特异性引物分别 为:Nl、N2、N3、N4、N5,W特异性引物的祀点与目标区域之间的距离为衡量标准,各特异性引物 之间的距离远近关系为:
[0060] 化〉化〉化〉N4〉化。
[0061] 发明人惊奇地发现,本发明的引物组合物能够有效地用于检测待测核酸样本目标 区域的序列信息,尤其是超低频突变的检测。具体地,利用本发明的引物组合物,能够有效 地通过PCR扩增富集所述待测核酸样本目标区域的序列,进而进行建库、测序,从而能够有 效确定待测核酸样本目标区域序列信息,包括目标区域中所包含的点突变、插入、缺失或基 因融合突变,并且检测灵敏度高,结果准确可靠。
[0062] 根据本发明的实施例,所述目标区域包含选自点突变、插入、缺失、基因融合突变 的至少之一。
[0063] 根据本发明的实施例,所述目标区域位于EGFR基因上。
[0064] 根据本发明的实施例,两条通用引物分别为:
[00化]第一通用引物:CAAGCAGAAGACGGCATACGA(SEQ ID N0:20),
[0066] 第二通用引物:AATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTCAGATGTGTATAAG AGACAG(SEQ ID N0:21)。由此,利用本发明的引物组合物富集目标区域序列后,能够方便地 利用Illumina测序平台(例如化xtSeqSOO)进行后续的建库和测序,W便实现目标区域的检 测。
[0067] 针对特异性引物组的各特异性引物,为方便理解,发明人用图5示出了上述目标区 域特异性引物(有时也称为"特异性引物")的结构:从5'端至3'端依次包括第一核酸序列、 连接序列和第二核酸序列。
[006引此外,根据本发明的实施例,所述目标区域特异性引物适用的PCR扩增程序必须: 能够先使所述第一核酸序列和模板退火,再使所述第二核酸序列和模板退火。
[0069] 换言之,利用上述目标区域特异性引物进行PC則寸,必须通过退火溫度的调节使宽 范围目标区域特异性序列先和模板退火,再降低退火溫度使精确目标区域特异性序列和模 板退火。由此,能够显著提高扩增的特异性。
[0070] 根据本发明的实施例,当n = 2-5的任意整数时,针对所述特异性引物组,其各特异 性引物的第一核酸序列的Tm值相近,第二核酸序列的Tm值相近,且所述第一核酸序列的Tm 值比所述第二核酸序列的Tm值大5-15C。由此,能够方便地在PCR扩增时实现先使所述第一 核酸序列和模板退火,再使所述第二核酸序列和模板退火。
[0071] 根据本发明的实施例,所述第一核酸序列不小于30bp,所述第二核酸序列不大于 lObp。
[0072] 根据本发明的一些具体示例,所述目标区域位于EGFR基因18号外显子上,n = 2,所 述特异性引物组的各特异性引物分别为:
[0073] EGFR18-SP1 :GTGACCCTTGTCTCTGTGTTCTTGTCCCCCCCAG(/'C-'G7'C4G/你 G 贿剧F A A GA GA CA GCTTGTGG AGC (SRO ID NO: 5),
[0074] EGFR18-SP2: CCAACCAAGCTCTCTTGAGGATCTTGAAGGAAACCCG'70G.47'6TGT A TAA GA GA CA G'TGAATTCAAA (SEQ ID NO: 6),
[0075] 其中,斜体且用下划线标记的序列为连接序列,位于连接序列的5'端的是第一核 酸序列,而位于连接序列的3 '端的是第二核酸序列。
[0076] 根据本发明的一些具体示例,所述目标区域位于EGFR基因19号外显子上,n = 2,所 述特异性引物组的各特异性引物分别为:
[0077] EGFR19-SP1: CAGATCACTGGGCAGCATGTGGCACCATCTCACA併-'(;八.-:46\47'(7乃7对 TAAGAGACAGATTGCCAGTT(SEQ ID N0:9),
[0078] EGFR19-SP2: CTCTGGATCCCAGAAGGTGAGAAAGTTAAAATTCGY;6T'G--?a47T;7T;7:4 7X4G.4G4C4GCCGTCGCTAT(沈Q ID NO: 10),
[0079] 其中,斜体且用下划线标记的序列为连接序列,位于连接序列的5'端的是第一核 酸序列,而位于连接序列的3 '端的是第二核酸序列。
[0080] 根据本发明的一些具体示例,所述目标区域位于EGFR基因20号外显子上,n = 3,所 述特异性引物组的各特异性引物分别为:
[0081 ] EGFR20-SP1 : TCAAGATCGCATTCATGCGTCTTCACCTGGAAGGGGT_(KX迂01 鱼1[。了 G巧FAi按IGATA^CCATGTGCCC(沈Q ID NO: 13),
[0082] EGFR20-SP2: hCGTGCCTCTCCCTCCCTCCAGGhhGCCTh^CGTCAGATGTGTATAAG AmCAGCGTGATGGCCiSEQ ID NO: 14),
[0083] EGFR20-SP3: CCTGCTGGGCATCTGCCTCACCTCCACCGTGCGTCAGATGTGTATAAGA GACAGGCAGCTCATC(SEQ ID NO: 15),
[0084] 其中,斜体且用下划线标记的序列为连接序列,位于连接序列的5'端的是第一核 酸序列,而位于连接序列的3 '端的是第二核酸序列。
[0085] 根据本发明的一些具体示例,所述目标区域位于EGFR基因21号外显子上,n = 2,所 述特异性引物组的各特异性引物分别为:
[0086] EGFR21-SP1 : C T G T T T C A G G G C A T G A A C T A C T T G G A G G A C C G T C G 6' CT; T'CA GA TO TG TA TAA GA GA CA GCTTGGTGCAC (SRO ID NO: 18),
[0087] EGFR21-SP2: GGTGAAAACACCGCAGCATGTCAAGATCACCaZLC4MIZ/IZ/;iIL4/lC iSifiiSAGATTTTGGG(SEQ ID NO: 19),
[0088] 其中,斜体且用下划线标记的序列为连接序列,位于连接序列的5'端的是第一核 酸序列,而位于连接序列的3 '端的是第二核酸序列。
[0089] 此外,需要说明的是,利用本发明的引物组合物,通过一次PCR即可W实现对目标 区域核酸序列的高特异性富集,也即本发明的引物组合物中包含的各引物(包括第一通用 引物、第二通用引物、各特异性引物)能够极大减少与模板DNA上目标片段W外的区域结合, 且对低丰度的模板的检测灵敏度很高。
[0090] 在本发明的第二方面,本发明提供了一种试剂盒。根据本发明的实施例,该试剂盒 包含前面所述的引物组合物。根据本发明的实施例,本发明的试剂盒能够有效地用于检测 待测核酸样本目标区域的序列信息,尤其是超低频突变的检测。具体地,利用该试剂盒中的 引物组合物,能够有效地通过PCR扩增富集所述待测核酸样本目标区域的序列,进而进行建 库、测序,从而能够有效确定待测核酸样本目标区域序列信息,包括目标区域中所包含的点 突变、插入、缺失或基因融合突变,并且检测灵敏度高,结果准确可靠,尤其适用于低频率突 变的检测。
[0091] 在本发明的第=方面,本发明提供了一种构建待测核酸样本的目标区域检测文库 的方法。根据本发明的实施例,该方法利用前面所述的引物组合物或试剂盒,通过PCR扩增 富集所述待测核酸样本目标区域的序列。
[0092] 由此,能够有效地基于前述的本发明的引物组合物或试剂盒进行建库,进而能够 有效地用于测序,W确定待测核酸样本目标区域序列信息,包括目标区域中所包含的点突 变、插入、缺失或基因融合突变,并且检测灵敏度高,结果准确可靠,尤其适用于超低频突变 的检测。
[0093] 根据本发明的实施例,所述方法包括:利用特异性引物组、第一通用引物和第二通 用引物的混合物对所述待测核酸样本进行第一PCR扩增,W便获得第一PCR扩增产物,其中 所述第一 PCR扩增产物构成所述待测核酸样本的目标区域检测文库。由此,利用本发明的引 物组合物,通过一次PCR即可实现对目标区域核酸序列的富集,方便快捷、且检测灵敏度高, 结果准确可靠。
[0094] 根据本发明的一些实施例,在进行所述第一 PCR扩增之前,进一步包括对所述待测 核酸样本进行预处理的步骤:对所述核酸样本进行接头连接处理;W及对接头连接产物进 行第二PCR扩增。由此,模板量大,有利于目标区域序列的PCR扩增富集。
[0095] 根据本发明的实施例,所述目标区域包含选自点突变、插入、缺失、基因融合突变 的至少之一。
[0096] 根据本发明的实施例,所述目标区域位于EGFR基因上。
[0097] 在本发明的第四方面,本发明提供了一种确定待测核酸样本目标区域序列信息的 方法。根据本发明的实施例,该方法包括:根据前面所述的构建待测核酸样本的目标区域检 测文库的方法,构建所述待测核酸样本的目标区域检测文库;对所述待测核酸样本的目标 区域检测文库进行测序,W便获得测序结果;W及基于所述测序结果,确定所述待测核酸样 本目标区域的序列信息。
[0098] 发明人发现,利用本发明的方法,能够有效地基于前述的本发明的引物组合物或 试剂盒构建目标区域的测序文库和测序,从而能够有效确定待测核酸样本目标区域序列信 息,包括目标区域中所包含的点突变、插入、缺失或基因融合突变,并且检测灵敏度高,结果 准确可靠,尤其适用于超低频突变的检测。
[0099] 在本发明的第五方面,本发明提供了一种构建待测核酸样本目标区域检测文库的 装置。根据本发明的实施例,该装置设置有前面所述的引物组合物,所述装置适于利用特异 性引物组、第一通用引物和第二通用引物的混合物对所述待测核酸样本进行第一 PCR扩增, W便获得第一 PCR扩增产物,其中所述第一 PCR扩增产物构成所述待测核酸样本的目标区域 检测文库。
[0100] 由此,利用该装置能够有效地基于前述的本发明的引物组合物或试剂盒进行建 库,进而能够有效地用于测序,W确定待测核酸样本目标区域序列信息,包括目标区域中所 包含的点突变、插入、缺失或基因融合突变,并且检测灵敏度高,结果准确可靠,尤其适用于 超低频突变的检测。
[0101] 根据本发明的实施例,进一步包括预处理单元,所述预处理单元适于在进行所述 第一 PCR扩增之前,按照W下步骤对所述待测核酸样本进行预处理:对所述核酸样本进行接 头连接处理;W及对接头连接产物进行第二PCR扩增。由此,可W扩大模板量,有利于目标区 域序列的PCR扩增富集。
[0102] 根据本发明的实施例,所述目标区域包含选自点突变、插入、缺失、基因融合突变 的至少之一。
[0103] 根据本发明的实施例,所述目标区域位于EGFR基因上。
[0104] 在本发明的第六方面,本发明提供了一种确定待测核酸样本目标区域序列信息的 系统。根据本发明的实施例,参照图6,该系统1000包括:构建待测核酸样本目标区域检测文 库的装置100、测序装置200和序列确定装置300。
[0105] 具体地,根据本发明的实施例,构建待测核酸样本目标区域检测文库的装置100用 于构建所述待测核酸样本的目标区域检测文库;测序装置200与构建待测核酸样本目标区 域检测文库的装置100相连,用于对所述待测核酸样本的目标区域检测文库进行测序,W便 获得测序结果;序列确定装置300与测序装置200相连,用于基于所述测序结果,确定所述待 测核酸样本目标区域的序列信息。
[0106] 发明人发现,利用该系统能够有效地基于前述的本发明的引物组合物或试剂盒构 建目标区域的测序文库和测序,从而能够有效确定待测核酸样本目标区域序列信息,包括 目标区域中所包含的点突变、插入、缺失或基因融合突变,并且检测灵敏度高,结果准确可 靠,尤其适用于超低频突变的检测。
[0107] 根据本发明的实施例,所述目标区域包含选自点突变、插入、缺失、基因融合突变 的至少之一。
[0108] 根据本发明的实施例,所述目标区域位于EGFR基因上。
[0109] 下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的 实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条 件的,按照本领域内的文献所描述的技术或条件(例如参考J.萨姆布鲁克等著,黄培堂等译 的《分子克隆实验指南》,第=版,科学出版社)或者按照产品说明书进行。所用试剂或仪器 未注明生产厂商者,均为可W通过市购获得的常规产品,例如可W采购自Illumina公司。
[0110] 实施例1
[0111] 根据本发明的确定待测核酸样本目标区域序列信息的方法,利用本发明的引物组 合物或试剂盒对样本进行目标区域突变检测,具体步骤如下:
[0112] 1.接头设计
[0113] Pre1ib-ADT-S:CAAGCAGAAGACGGCATACGAGATI11111IGTGACTGGAGTTCAGACGTGTGCTC TTCCGATCTQ 为 index区),
[0114] Pre1ib-ADT-AS:pGATCGGAAGAGC,
[0115] W上序列需要退火成双链。
[0116] 连接后产物结构:
[0117] Top:5'-CAAGCAGAAGACGGCATACGAGATIIIIIIIGTGACTGGAGTTCAGACGTGTGCTCTTCCGA TCTAGATCGGAAGAGC-3',
[0118] Bottom:5 '-CAAGCAGAAGACGGCATACGAGATIIIIIIIGTGACTGGAGTTCAGACGTGTGCTCTTC CGATCTAGATCGGAAGAGC-3'。
[0119] 2.引物设计
[0120] 2.1预文库PCR引物如下:
[01 別]Pre-primerl:GCTCTTCCGATC(SEQ ID N0:1),
[0122] Pre-primer2:CAAGCAGAAGACGGCA(SEQ ID N0:2)〇
[0123] 2.1特异性引物设计
[0124] 需注意的是,为便于识别,将各特异性引物的结构均进行了标记,具体地:
[0125] 各特异性引物中斜体且用下划线标记的序列为连接序列,位于连接序列的5'端的 是第一核酸序列,而位于连接序列的3 '端的是第二核酸序列。
[0126] (1)针对EGFR的18号外显子上待检测位点设计同向延伸特异性引物:
[0127] EGFR18号外显子序列如下:
[01 巧]CTTGTGGAGCCTCTTACACCCAGTGGAGAAGCTCCCAACCAAGCTCTCTTGAGGATCTTGAAGGAAACT GAATTCAAAAAGATCAAAGTGCTGGGCTCCGGTGCGTTCGGCACGGTGTATAAG(SEQ ID NO:3),
[0129] EGFR18号外显子及其上下游内含子区序列如下:
[0130] ATGCCGTGGCTGCTGGTCCCCCTGCTGGGCCATGTCTGGCACTGCTTTCCAGCATGGTGAGGGCTGAGG TGACCCTTGTCTCTGTGTTCTTGTCCCCCCCAGCTTGTGGAGCCTCTTACACCCAGTGGAGAAGCTCCCAACCAAGC TCTCTTGAGGATCTTGAAGGAAACTGAATTCAAAAAGATCAAAGTGCTGGGCTCCGGTGCGTTCGGCACGGTGTATA AGGTAAGGTCCCTGGCACAGGCCTCTGGGCTGGGCCGCAGGGCCTCTCATGGTCTGGTGGGGAGCCCAGAGTCCTTG CAAGCTGTATATTTCCATCATCTACTTTACTCTTTGTTTCACT(SEQ ID NO:4),
[0131 ] EGFR18号外显子同向延伸特异性引物序列如下:
[0132] EGFR18-SP1 :GTGACCCTTGTCTCTGTGTTCTTGTCCCCCCCAGGCG7r:4G:47'G7'G7:47^ 儿(一G.4('.'4G'CTTGTGGAGC(沈Q ID N0:5),
[0133] EGFR18-SP2: CCA ACC A AGCTCTCTTGAGGATCTTG A AGG A A AC6rG70GVrf6TGr .你心樹鮮猫GTGA ATTCA A A (SRQ ID NO: 6)。
[0134] (2)针对EGFR的19号外显子待检测位点设计同向延伸特异性引物:
[01巧]EGFR19号外显子序列如下:
[0。6] GGACTCTGGATCCCAGAAGGTGAGAAAGTTAAAATTCCCGTCGCTATCAAGGAATTAAGAGAAGCAACA TCTCCGAAAGCCAACAAGGAAATCCTCGAT(沈Q ID N0:7),
[0137] EGFR19号外显子及其上下游内含子区序列如下:
[0138] GCCTTAGGTGCGGCTCCACAGCCCCAGTGTCCCTCACCTTCGGGGTGCATCGCTGGTAACATCCACCCA GATCACTGGGCAGCATGTGGCACCATCTCACAATTGCCAGTTAACGTCTTCCTTCTCTCTCTGTCATAGGGACTCTG GATCCCAGAAGGTGAGAAAGTTAAAATTCCCGTCGCTATCAAGGAATTAAGAGAAGCAACATCTCCGAAAGCCAACA AGGAAATCCTCGATGTGAGTTTCTGCTTTGCTGTGTGGGGGTCCATGGCTCTGAACCTCAGGCCCACCTTTTCTCAT GTCTGGCAGCTGCTCTGCTCTAGACCCTGCTCATCTCCACATCCTAAA(SEQ ID NO:8),
[0139] EGFR19号外显子同向延伸特异性引物序列如下:
[0140] EGFR19-SP1: CAGATCACTGGGCAGCATGTGGCACCATCTCACA6rG7r/jG.4TGTG7>j TAAGAGACAGATTGCCAOTT(SKQ ID NO:9),
[0141] EGFR19-SP2: CTCTGGATCCCAGAAGGTGAGAAAGTTAAAATTC避型巡錫經鹽SH 7A4G'jG/iC、.4GCCGTCGCTAT(沈Q ID NO: 10)。
[0142] (3)针对EGFR的20号外显子待检测位点设计同向延伸特异性引物:
[0143] EGFR20号外显子序列如下:
[0144] GAAGCCTACGTGATGGCCAGCGTGGACAACCCCCACGTGTGCCGCCTGCTGGGCATCTGCCTCACCTCC ACCGTGCAGCTCATCACGCAGCTCATGCCCTTCGGCTGCCTCCTGGACTATGTCCGGGAACACAAAGACAATATTGG CTCCCAGTACCTGCTCAACTGGTGTGTGCAGATCGCAAAG(SEQ ID NO:11),
[0145] EGFR20号外显子及其上下游内含子区序列如下:
[0146] TCCATGAGTACGTATTTTGAAACTCAAGATCGCATTCATGCGTCTTCACCTGGAAGGGGTCCATGTGCC CCTCCTTCTGGCCACCATGCGAAGCCACACTGACGTGCCTCTCCCTCCCTCCAGGAAGCCTACGTGATGGCCAGCGT GGACAACCCCCACGTGTGCCGCCTGCTGGGCATCTGCCTCACCTCCACCGTGCAGCTCATCACGCAGCTCATGCCCT TCGGCTGCCTCCTGGACTATGTCCGGGAACACAAAGACAATATTGGCTCCCAGTACCTGCTCAACTGGTGTGTGCAG ATCGCAAAGGTAATCAGGGAAGGGAGATACGGGGAGGGGAGATAAGGAGCCAGGATC(SEQ ID NO:12),
[0147] EGFR20号外显子同向延伸特异性引物序列如下:
[0148] EGFR20-SP1 :TCAAGATCGCATTCATGCGTCTTCACCTGGAAGGGGTGCGTC4a4r6T GTATAAGAGACAGCCATGTGCCC(SKQ ID NO: 13),
[0149] EGFR20-SP2: ACGTGCCTCTCCCTCCCTCCAGGAAGCCTA 远岛[1鱼1坚亞迂iZ生迫 -4Gi0GCGTGATGGCC(SEQ ID NO: 14),
[01 加 ]EGFR20-SP3 : CCTGCTGGGCATCTGCCTCACCTCCACCGT垃里互逆 GA CAGGCAGCTCATC(SEQ ID NO:15),
[0151] (4)针对EGFR的21号外显子待检测位点设计同向延伸特异性引物
[0152] EGFR21号外显子序列如下:
[01 巧]GGCATGAACTACTTGGAGGACCGTCGCTTGGTGCACCGCGACCTGGCAGCCAGGAACGTACTGGTGAAA ACACCGCAGCATGTCAAGATCACAGATTTTGGGCTGGCCAAACTGCTGGGTGCGGAAGAGAAAGAATACCATGCAGA AGGAGGCAAA(SEQ ID NO:16),
[0154] EGFR21号外显子及其上下游内含子区序列如下:
[01 巧]GAGGCTCAGAGCCTGGCATGAACATGACCCTGAATTCGGATGCAGAGCTTCTTCCCATGATGATCTGTC CCTCACAGCAGGGTCTTCTCTGTTTCAGGGCATGAACTACTTGGAGGACCGTCGCTTGGTGCACCGCGACCTGGCAG CCAGGAACGTACTGGTGAAAACACCGCAGCATGTCAAGATCACAGATTTTGGGCTGGCCAAACTGCTGGGTGCGGAA GAGAAAGAATACCATGCAGAAGGAGGCAAAGTAAGGAGGTGGCTTTAGGTCAGCCAGCATTTTCCTGACACCAGGGA CCAGGCTGCCTTCCCACTAGCTGTATTGTTTAACACATGCAGGGGAGGATGCTCTCCAGA(SEQ ID NO:17),
[0156] EGFR21号外显子同向延伸特异性引物序列如下:
[0157] EGFR21-SP1 :CTGTTTCAGGGCATGAACTACTTGGAGGACCGTCGGCG7CiGiIG7G: 7:4C4GCTTGGTGCAC(沈Q ID NO: 18),
[0158] EGFR21-SP2:GGTGAAAACACCGCAGCATGTCAAGATCAC 远运亞i 鱼1坚坚 A GA CA GAGATTTTGGG (SRO ID NO: 19),
[0159] 通用引物序列如下:
[0160] 第一通用引物(Uni-Primerl):CAAGCAGAAGACGGCATACGA(SEQ ID N0:20);
[0161] 第二通用引物化ni-Primer2): AATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTC AGATGTGTATAAGAGACAG(SEQ ID N0:21)。
[0162] 3.抽取5ml健康人外周血,分离2ml血浆,提取游离DM。
[0163] 4.游离DM末端修复
[0164] 配制如下反应:
[01化]表1
[0166]
[0167] PCR仪上20°C溫浴30分钟。
[0168] 使用12化1 Ampure XP beads进行纯化,3化 1 Elution Buffer洗脱。
[0169] 5.3'端加多聚腺嚷岭尾
[0170] 配制如下反应:
[0171] 表2
[0172]
[0173] PCR仪上37°C溫浴30分钟。
[0174] 使用60iU Ampure XP beads进行纯化,1化1 Elution Buffer洗脱。
[0175] 6.连接接头
[0176] 配制如下反应:
[0177] 表3 [017 引
[0179]
[0180] PCR仪上20°C溫浴15分钟。
[0181] 使用60]il Ampure XP beads进行纯化,3化 1 Elution Buffer洗脱。
[0182] 7.预文库扩增
[0183] 配制如下反应:
[0184] 表4
[0185]
[0186] PCR程序如下:
[0187] a)95°C3 分钟;
[018引 b) 10循环程序如下:
[0189] 95°C15 秒
[0190] 62°C30 秒
[0191] 72°C30 秒
[0192] c)72°C5 分钟
[0193] d)4°C 保存。
[0194] 取加 1 PCR产物进行2%琼脂糖胶电泳检测。检测结果见图1所示。
[0195] 剩余PCR产物使用5化1 Ampure XP beads进行纯化,2化1 Elution Buffer洗脱。
[0196] 8.递进式目标区域富集
[0197] 将各外显子的同向延伸特异性引物全部混合,W便得到巧GFR特异性引物组",然 后配制如下反应,W便一次PCR检测多个位点:
[019引表5
[0199]
0200 0201 0202 PCR程序如下: a)95°C10 分钟; b)2个循环程序如下:
[0203] 95°C30 秒
[0204] 68°C30 秒
[0205] 72°C1 分钟
[0206] c) 18个循环程序如下:
[0207] 95°C30 秒
[020引 58°C30 秒
[0209] 72°C1 分钟
[0210] d)72°C7 分钟 e)4°C 保存。
[0212] 使用60ulAmpure XP beads进行纯化,30u化B洗脱。
[0213] 取其中化1纯化产物进行2%琼脂糖凝胶电泳检测,检测结果见图2所示。
[0214] 9.文库经过巧光定量PCR质控后,进行Illumina公司化xtSeqSOO进行75bp双端测 序。
[0215]将高通量测序下机数据经过质控过滤后,进行BWA比对,评估各个目标检测位点得 到的序列数,分析结果见表6。
[0^6]表 6
[0217]
0218 0219 0220 0221 0222 0223
[0218] 本实施例使用的样本为健康人的血浆(其待检测区域并不含有突变),上述结果表 明:利用本发明的方法及试剂盒能够同时检测到目标区域巧6。318、19、20、2巧外显子的目 标区域)。
[0219] 实施例2
[0220] 根据实施例1的方法对样本进行目标区域突变检测,区别仅在于:本实施例采用的 样本来自册RIZ0N DISCOVERY公司的商业化标准品MultiplexIcfDNAReferenceStandardSe t(Catalogue#:HD780),取该产品中在EGFR待检区域突变频率分别为0% (野生型)和1%的 片段化DNA样本进行检测。
[0221] 其中,预文库扩增的PCR产物的电泳检测结果如图3所示,递进式目标区域富集后 纯化产物的电泳检测结果如图4所示。
[0222] 将高通量测序下机数据经过质控过滤后,进行BWA比对,并对数据进行进一步分 析,评估突变检测比例,分析结果见表7。
[0223] 表 7
[0224]
[0225] 上述结果表明,利用本发明的方法和试剂盒能够准确检测突变频率低至1 %的 EGFR基因突变。
[0226] 综上,结合实施例1与实施例2,结果表明,本发明能够成功地对核酸样本的目标区 域化GFR基因待检区域)进行特异性检测,且灵敏度高,结果准确可靠。
[0227] 在本说明书的描述中,参考术语"一个实施例"、"一些实施例"、"示例"、"具体示 例"、或"一些示例"等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特 点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不 一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可W在任何 的一个或多个实施例或示例中W合适的方式结合。
[0228] 尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可W理解:在不 脱离本发明的原理和宗旨的情况下可W对运些实施例进行多种变化、修改、替换和变型,本 发明的范围由权利要求及其等同物限定。
【主权项】
1. 一种用于检测待测核酸样本目标区域的引物组合物,其特征在于,包括: 第一通用引物和第二通用引物,所述第一通用引物和所述第二通用引物的靶点位于所 述目标区域的两端,分别用于构成测序文库的5 '端和3 '端;以及 特异性引物组,所述特异性引物组包括n条特异性引物,各特异性引物的结构相同,均 是从5 '端至3 '端依次包括第一核酸序列、连接序列和第二核酸序列, 其中,各特异性引物均满足下列条件: (1) 各特异性引物的靶点,均是与所述第一通用引物的靶点分别位于所述目标区域的 两端,而与所述第二通用引物的靶点位于所述目标区域的同端; (2) 所述第一核酸序列和所述第二核酸序列对应的基因组位置位于所述目标区域的同 端; (3) 所述第一核酸序列对应的基因组位置与所述目标区域之间的距离,大于所述第二 核酸序列对应的基因组位置与所述目标区域之间的距离; (3) 所述第一核酸序列和所述第二核酸序列在对应的基因组位置上是连续的,但无碱 基重合; (4) 所述第一核酸序列的5'端第一个碱基距离目标区域不超过待测核酸样本的碱基长 度; (5) 所述连接序列由所述第二通用引物的3 '端末的24个碱基构成; (6) n=l-5的任意整数,以n = 5为例,设所述特异性引物组的各特异性引物分别为:他、 N2、N3、N4、N 5,以特异性引物的靶点与目标区域之间的距离为衡量标准,各特异性引物之间 的距离远近关系为: Nl〉N2>N3>N4>N5。2. 根据权利要求1所述的引物组合物,其特征在于,所述第一核酸序列不小于30bp,所 述第二核酸序列不大于l〇bp, 任选地,所述目标区域特异性引物适用的PCR扩增程序必须:能够先使所述第一核酸序 列和模板退火,再使所述第二核酸序列和模板退火, 任选地,当n = 2-5的任意整数时,针对所述特异性引物组,其各特异性引物的第一核酸 序列的Tm值相近,第二核酸序列的Tm值相近,且所述第一核酸序列的Tm值比所述第二核酸 序列的Tm值大5-15°C, 任选地,所述目标区域包含选自点突变、插入、缺失、基因融合突变的至少之一, 任选地,所述目标区域位于EGFR基因上。3. 根据权利要求1所述的引物组合物,其特征在于,两条通用引物分别为:任选地,所述目标区域位于EGFR基因18号外显子上,n = 2,所述特异性引物组的各特异 性引物分别为:其中,斜体且用下划线标记的序列为连接序列,位于连接序列的5'端的是第一核酸序 列,而位于连接序列的3 '端的是第二核酸序列, 任选地,所述目标区域位于EGFR基因19号外显子上,n = 2,所述特异性引物组的各特异 性引物分别为:其中,斜体且用下划线标记的序列为连接序列,位于连接序列的5'端的是第一核酸序 列,而位于连接序列的3 '端的是第二核酸序列, 任选地,所述目标区域位于EGFR基因20号外显子上,n = 3,所述特异性引物组的各特异 性引物分别为:其中,斜体且用下划线标记的序列为连接序列,位于连接序列的5'端的是第一核酸序 列,而位于连接序列的3 '端的是第二核酸序列, 任选地,所述目标区域位于EGFR基因21号外显子上,n = 2,所述特异性引物组的各特异 性引物分别为:其中,斜体且用下划线标记的序列为连接序列,位于连接序列的5'端的是第一核酸序 列,而位于连接序列的3 '端的是第二核酸序列。4. 一种试剂盒,其特征在于,包含权利要求1-3任一项所述的引物组合物。5. -种构建待测核酸样本的目标区域检测文库的方法,其特征在于, 利用权利要求1-3任一项所述的引物组合物或权利要求4所述的试剂盒,通过PCR扩增 富集所述待测核酸样本目标区域的序列。6. 根据权利要求5所述的方法,其特征在于,所述方法包括: 利用特异性引物组、第一通用引物和第二通用引物的混合物对所述待测核酸样本进行 第一PCR扩增,以便获得第一PCR扩增产物,其中所述第一PCR扩增产物构成所述待测核酸样 本的目标区域检测文库, 任选地,在进行所述第一 PCR扩增之前,进一步包括对所述待测核酸样本进行预处理的 步骤: 对所述核酸样本进行接头连接处理;以及 对接头连接产物进行第二PCR扩增, 任选地,所述目标区域包含选自点突变、插入、缺失、基因融合突变的至少之一, 任选地,所述目标区域位于EGFR基因上。7. -种确定待测核酸样本目标区域序列信息的方法,其特征在于,包括: 根据权利要求5或6所述的方法,构建所述待测核酸样本的目标区域检测文库; 对所述待测核酸样本的目标区域检测文库进行测序,以便获得测序结果;以及 基于所述测序结果,确定所述待测核酸样本目标区域的序列信息。8. -种构建待测核酸样本目标区域检测文库的装置,其特征在于,设置有权利要求1-3 任一项所述的引物组合物,所述装置适于利用特异性引物组、第一通用引物和第二通用引 物的混合物对所述待测核酸样本进行第一PCR扩增,以便获得第一PCR扩增产物,其中所述 第一PCR扩增产物构成所述待测核酸样本的目标区域检测文库。9. 根据权利要求8所述的装置,其特征在于,进一步包括预处理单元,所述预处理单元 适于在进行所述第一 PCR扩增之前,按照以下步骤对所述待测核酸样本进行预处理: 对所述核酸样本进行接头连接处理;以及 对接头连接产物进行第二PCR扩增, 任选地,所述目标区域包含选自点突变、插入、缺失、基因融合突变的至少之一, 任选地,所述目标区域位于EGFR基因上。10. -种确定待测核酸样本目标区域序列信息的系统,其特征在于,包括: 权利要求8或9所述的构建待测核酸样本目标区域检测文库的装置,用于构建所述待测 核酸样本的目标区域检测文库; 测序装置,所述测序装置与所述构建待测核酸样本目标区域检测文库的装置相连,用 于对所述待测核酸样本的目标区域检测文库进行测序,以便获得测序结果;以及 序列确定装置,所述序列确定装置与所述测序装置相连,用于基于所述测序结果,确定 所述待测核酸样本目标区域的序列信息, 任选地,所述目标区域包含选自点突变、插入、缺失、基因融合突变的至少之一, 任选地,所述目标区域位于EGFR基因上。
【文档编号】C12N15/10GK106048008SQ201610387723
【公开日】2016年10月26日
【申请日】2016年6月3日
【发明人】王永利, 宋卓, 袁梦兮
【申请人】人和未来生物科技(长沙)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1