一种检测乳腺癌易感基因的方法及试剂盒的制作方法

文档序号:401317阅读:223来源:国知局
专利名称:一种检测乳腺癌易感基因的方法及试剂盒的制作方法
技术领域
本发明涉及基因工程领域,更具体地说,涉及一种检测乳腺癌易感基因的方法及试剂盒。
背景技术
易感基因是指和特定疾病具有一定关联的基因或等位基因。对复杂疾病的易感基因及突变位点进行检测,可得到其具体的基因序列信息。在此基础上,可以结合后续进一步的分子生物学试验、临床试验、临床观察及综合数据的统计分析,建立疾病模型,从而实现早期评估疾病的易感性并采取相应预防措施降低疾病的发生几率。大量研究证实遗传因素在疾病的易感性中发挥重要作用,复杂疾病的遗传因素己证实存在微效基因剂量效应,即微效基因作用的累加才可以形成明显的表型综合效应。因此,对疾病的多个易感基因及突变位点进行检测至关重要,特别是针对基因组中最主要的遗传突变形式——单核苷酸多态性(Single Nucleotide Polymorphisms, SNP),它约占整个基因组中遗传突变的92%。乳腺癌是严重影响妇女健康的最常见恶性肿瘤之一,全世界每年约有120万妇女发生乳腺癌,有50万妇女死于乳腺癌,我国妇女的乳腺癌发病率也正逐年上升。临床表明, 早期乳腺癌的治愈率可达80 90%,因此早期检测及预防对乳腺癌的治疗起到重要的作用。乳腺癌易感基因是与乳腺癌的发生具有紧密关联的基因。目前,检测乳腺癌易感基因的常见方法是Sanger测序法,该方法能对乳腺癌易感基因进行区域检测,但Sanger 测序法每次只能对一个样品的某一段区域进行测序,因此检测效率低、成本高;而且由于 sanger测序原理的限制,在检测带有杂合子的样品信号时会出现双峰乃至多峰,使得该样品无法准确识别出来,导致检测灵敏度低(20% )。此外,用于乳腺癌易感基因检测的另一种常用方法是基因芯片法,该方法只能针对一个或数个已知突变的位点设计检测探针形成检测芯片,因此无法用于检测未知突变位点,检测的结果也就不够全面、准确。目前市面上基于现有技术的检测方法所形成的检测试剂盒,只针对单个区域或已知的一个或数个SNP位点进行检测,检测结果不够全面准确。因此需要一种检测乳腺癌易感基因的新方法和新试剂盒,能够提高检测效率、降低成本,还能提高检测灵敏度和准确性。

发明内容
本发明的目的在于提供一种检测乳腺癌易感基因的方法及试剂盒,能对乳腺癌易感基因的多个区域同时进行检测,提高检测效率,降低成本,还能提高检测灵敏度和准确性。为了实现发明目的,一种检测乳腺癌易感基因的方法,包括以下步骤A.利用乳腺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,并基于扩增产物构建测序文库;B.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;C.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息。其中,步骤A包括Al.利用乳腺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,得到与所述多个目标区域对应的扩增产物;A2.利用接头元件,与所述多个目标区域对应的扩增产物进行连接,得到测序文库;所述接头元件采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。其中,所述步骤A2包括以下步骤A21.对与所述多个目标区域对应的扩增产物进行片段化,得到片段化产物;A22.利用接头元件,与所述片段化产物进行连接,构建测序文库。其中,所述步骤A22包括以下步骤A221.利用第一接头与片段化产物的两端连接,得第一连接产物;A222.环化第一连接产物,得环化产物;A223. II s型限制性内切酶酶切环化产物,得酶切产物;A224.在酶切产物两端接上第二接头和第三接头,得测序文库。其中,所述步骤A22包括以下步骤Α22Γ .利用第四接头与片段化产物连接,得第二连接产物;A222’ . II s型限制性内切酶酶切第二连接产物,得带有第四接头的酶切片段;A223’ .带有第四接头的酶切片段与第五接头连接,形成测序文库。其中,步骤A2所述接头元件中的至少一个接头包含有第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库进行标记。所述第一标签序列,优选为带有特定序列的核酸分子,用于识别不同的待测样品。所述第一标签序列碱基个数不限,优选为3 20,更优选为4 10。其中,步骤A中所述的乳腺癌易感基因有多个,每个乳腺易感基因的目标区域对应的特异性引物中的至少一条与该目标区域部分互补,且该引物的5’端带有第二标签序列,用于在扩增目标区域过程中,对不同待测样品的目标区域扩增产物进行标记。所述第二标签序列优选为带有特定序列的核酸分子,其碱基个数不限,优选为3 20,更优选为4 10。其中,所述待测易感基因包括FGFR2、GSTPl、IL-I β、和MTHFR中的至少一个。进一步的,所述FGFR2的特异性引物为SEQ ID NO :1和SEQ ID NO 2 ;所述GSTPl 的特异性引物为SEQ ID NO :3和SEQ ID NO 4 ;所述IL-I β的特异性引物为SEQ ID NO 5 和 SEQ ID NO 6 ;所述 MTHFR 的特异性引物为 SEQ ID NO 7 和 SEQ ID NO :8。其中,所述方法还包括步骤D.利用GSTMl的特异性扩增引物对待测样品进行PCR扩增,凝胶电泳检测GSTMl 基因的缺失情况。
其中,步骤D与步骤A、B或C之间均无先后顺序关系。进一步的,所述GSTMl 的扩增引物包括 SEQ ID NO :9 和 SEQ ID NO 10, SEQ ID NO: 11和SEQ ID NO 12中的至少一对。一种能够用于本发明的任一种检测乳腺癌易感基因方法的试剂盒,包括乳腺癌易感基因特异性引物,用于对待测样品中的多个目标区域进行扩增;接头元件,用于与扩增产物结合构建测序文库。其中,所述接头元件采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。其中,所述接头元件中的至少一个接头包含有第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库进行标记。所述第一标签序列优选为带有特定序列的核酸分子,其碱基个数不限,优选为 3 20,更优选为4 10。其中,所述待测乳腺癌易感基因有多个,对应的特异性引物中至少有一条引物与目标区域部分互补,且该引物的5’端带有第二标签序列,所述第二标签序列用于在扩增目标区域过程中,对不同待测样品的目标区域扩增产物进行标记。所述第二标签序列为带有特定序列的核酸分子,碱基个数不限,优选为3 20,更优选为4 10。其中,所述乳腺癌易感基因包括FGFR2、GSTPl、IL-I β、和MTHFR以及GSTMl中的至少一个。进一步的,所述FGFR2的特异性引物为SEQ ID NO :1和SEQ ID NO 2 ;所述GSTPl 的特异性引物为SEQ ID NO 3和SEQ ID NO 4 ;所述IL-I β的特异性引物为SEQ ID NO 5 和 SEQ ID NO 6 ;所述 MTHFR 的特异性引物为 SEQ ID NO 7 和 SEQ ID NO 8 ;所述 GSTMl 的特异性引物包括 SEQ ID NO :9 和 SEQ ID NO : 10、SEQ ID Ν0:11 和 SEQ ID Ν0:12 中的至少一对。由上可知,本发明提供的检测乳腺癌易感基因的方法及试剂盒,能对乳腺癌易感基因的多个区域同时进行检测,因此提高了检测效率,降低了检测成本;另外该方法也能突破传统检测方法的限制,能够对包含有杂合子的样品进行识别,因此提高了检测灵敏度;此外还能检测包括已知突变和未知突变位点的变异情况,因此提高了检测结果的全面性和准确性。


图I是本发明一个实施例中检测乳腺癌易感基因的方法流程图;图2是本发明用于构建测序文库的方法流程图;图3是本发明一个实施例中的突出末端接头的结构示意图;图4是本发明一个实施例中的带茎环结构的接头的结构示意图;图5是本发明另一个实施例中的带茎环结构的接头的结构示意图;图6是本发明所用分叉接头的结构示意图;图7是本发明一个实施例中的分叉接头的结构示意图;图8是本发明另一个实施例中的分叉接头的结构示意图9是本发明另一个实施例中的分叉接头的结构示意图;图10是本发明一个实施例中利用片段化产物和接头元件构建测序文库的方法流程图;图11是本发明另一个实施例中利用片段化产物和接头元件构建测序文库的方法流程图;图12是本发明另一个实施例中检测乳腺癌易感基因的方法流程图。
具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。本发明所述的目标区域,为乳腺癌易感基因上的任意序列,可根据需要进行选择, 包括但不限于基因的内部序列、基因的外部调控区域,所述基因内部序列,包括但不限于基因的内含子区域、外显子区域、同时含有内含子与外显子的区域。图I示出了本发明的一种检测乳腺癌易感基因的方法流程,该方法包括以下步骤SI.利用乳腺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,并基于扩增产物构建测序文库;S2.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;S3.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息。本方法利用高通量测序技术对乳腺癌易感基因进行区域测序,能对乳腺癌易感基因的多个区域同时进行检测,提高检测效率,降低成本;同时利用高通量基因测序技术突破传统检测技术的限制,提高检测灵敏度;同时还能检测包括已知突变和未知突变位点的变异情况,得到全面准确的检测结果。通过本方法检测得到的乳腺癌易感基因序列信息,可以结合后续进一步的分子生物学试验、临床试验、临床观察及综合数据的统计分析,建立一定的乳腺癌疾病模型,实现早期评估乳腺癌的易感性。需要说明的是其中,步骤SI中所述待测样品为能提取核酸的任意形式的样品,包括但不限于 全血、血清、血浆和组织样品;所述组织样品包括但不限于石蜡包埋组织、新鲜组织和冰冻切片。步骤SI中所述的多个目标区域,它们可来源于同一个乳腺癌易感基因,也可来源于不同的乳腺癌易感基因。步骤SI所得测序文库中,存在多种测序文库分子,对测序文库进行单分子扩增, 即是指,将测序文库中的多种文库分子,以极微量(甚至单分子)的形式在空间上隔离(但这些文库分子整体上还是属于同一个反应体系),并且在各自的空间内实现扩增。现有技术中,Sanger测序技术每次只能对一个样品的某一段区域进行测序,要实现对多个目标区域的测序,只能是通过多次反应来实现。而在本发明中,测序文库中的各个分子经过单分子扩增后,每个测序文库分子均形成单分子拷贝阵列,各单分子拷贝阵列在进行高通量基因测序时处于不同的位置,使得测序引物与单分子拷贝阵列之间的杂交,以及在酶作用下的延伸反应可同时进行,相互之间互不干扰。因此,可以同时对大量的(成百万上千万,甚至更多的)单分子拷贝阵列同时进行测序反应,然后通过采集相应的信号, 进而获得所需的序列信息,且测序的灵敏度较Sanger更高。其中,步骤SI所述的特异性引物与目标区域完全互补或部分互补。进一步的,每对针对目标区域的特异性引物中至少有一条与目标区域完全或部分互补,且该引物的5’端带有第二标签序列。该第二标签序列,用于在扩增目标区域过程中, 对不同待测样品的目标区域扩增产物进行标记。该第二标签序列,优选为带有特定序列的核酸分子,其碱基个数不限。该第二标签序列的碱基数优选为3 20,更优选为4 10。此外,所述特异性引物还可带有其他标记,包括但不限于生物素标记和其他抗性标记,用于对扩增产物进行分离纯化。另外,当待测乳腺癌易感基因有多个时,同一待测样品的不同乳腺癌易感基因的扩增可同时进行或分别独立进行或部分同时进行。在具体的实验过程中,可根据需要选用上述任一种方案进行。若分别进行扩增时,需要保证用于构建测序文库的扩增产物的量是一致的。当待测样品有多个时,不同样品的乳腺癌易感基因的扩增必须分别进行。其中,步骤SI所述的乳腺癌易感基因包括rsl0795668、MMP2、SMAD7、ADH2、ALDH2、 CYPlA2、MMP-l、MTHFR、TP53、VEGF、C0X-2、DNMT3B、hMLHl、L0C727677、MMP9、MTRR 和 TGF-β I 中的至少一个。进一步的,所述rsl0795668 的特异性引物为 SEQ ID NO :1 和 SEQ ID NO :2、SEQ ID NO :3和SEQ ID NO :4中的至少一对;所述MMP2的特异性引物为SEQ ID NO :5和SEQ ID N0:6、SEQ ID NO :7和SEQ ID NO :8中的至少一对;所述SMAD7的特异性引物为SEQ ID NO: 9和SEQ ID NO 10,SEQ ID NO 11和SEQ ID NO 12中的至少一对;所述ADH2的特异性引物为 SEQ ID NO 13 和 SEQ ID NO :14、SEQ ID NO 15 和 SEQ ID NO 16 中的至少一对;所述 ALDH2 的特异性引物为 SEQ ID N0:17 和 SEQ ID NO 18,SEQ ID N0:19 和 SEQ ID NO 20 中的至少一对;所述CYP1A2的特异性引物为SEQ ID NO 21和SEQ ID NO :22、SEQ ID NO 23和SEQ ID NO 24中的至少一对;所述MMP-I的特异性引物为SEQ ID NO 25和SEQ ID NO 26,SEQ ID NO :27和SEQ ID NO :28中的至少一对;所述MTHFR的特异性引物为SEQ ID NO 29 和 SEQ ID NO 30,SEQ ID NO 31 和 SEQ ID NO 32 中的至少一对;所述 TP53 的特异性引物为 SEQ ID N0:33 和 SEQ ID NO :34、SEQ ID N0:35 和 SEQ ID NO :36 中的至少一对; 所述 VEGF 的特异性引物为 SEQ ID NO 37 和 SEQ ID NO :38、SEQ ID NO 39 和 SEQ ID NO 40中的至少一对;所述C0X-2的特异性引物为SEQ ID N0:41和SEQ ID NO : 42、SEQ ID NO: 43和SEQ ID NO 44中的至少一对;所述DNMT3B的特异性引物为SEQ ID NO 45和SEQ ID NO 46,SEQ ID NO :47和SEQ ID NO 48中的至少一对;所述hMLHl的特异性引物为SEQ ID NO 49 和 SEQ ID NO :50、SEQ ID NO 51 和 SEQ ID NO 52 中的至少一对;所述 L0C727677 的特异性引物为 SEQ ID NO 53 和 SEQ ID NO :54、SEQ ID NO 55 和 SEQ ID NO 56 中的至少一对;所述 MMP9 的特异性引物为 SEQ ID NO 57 和 SEQ ID NO 58,SEQ ID NO 59 和 SEQ ID NO 60中的至少一对;所述MTRR的特异性引物为SEQ ID NO 61和SEQ ID NO :62、SEQ ID NO :63和SEQ ID NO :64中的至少一对;所述TGF-β I的特异性引物为SEQ ID NO :65和SEQ ID NO :66、SEQ ID NO 67 和 SEQ ID NO 68 中的至少一对。在一个实施例中,步骤SI的具体实现过程是Sll.利用乳腺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增, 得到与所述多个目标区域对应的扩增产物;S12.利用接头元件,与所述多个目标区域对应的扩增产物进行连接,得到测序文库;所述接头元件采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。需要说明的是步骤Sll中,对同一待测样品中的多个目标区域的扩增,可同时进行或分别独立进行或部分同时进行。可根据实际情况,如扩增所用的乳腺癌易感基因特异性引物的退火温度,扩增的目标区域的大小、GC含量,扩增的目标区域的数量等,进行相应的调整。不同待测样品的目标区域的扩增必须分别进行。步骤S12中,所述接头元件与扩增产物的连接方式,可以采用多种方式实现,包括接头元件与扩增产物直接连接,或对扩增产物进行处理之后再进行连接。步骤S12所述接头元件,用于构建测序文库,可包括一种或多种接头。其中,所述接头元件中的至少一个接头包含有第一标签序列,该第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库进行标记。这样,在分别获得目标区域测序文库后,不同的待测样品的目标区域测序文库可以混合在同一个反应体系中,进行单分子扩增反应,进而同时进行高通量测序。提高测序反应的效率,降低了样品检测的成本。该第一标签序列优选为带有特定序列的核酸分子,其碱基个数不限。该第一标签序列的碱基个数优选为3 20,这样,每次至少能同时对43个样品进行检测;综合考虑各种情况,其碱基个数更优选为4 10。通过第二标签序列和第一标签序列的结合,本发明的发明每次能够检测至少 43 X 43个样品,即4096个样品。接头的修饰方式有多种,包括但不限于可被生物素化或甲基化,或同时被生物素化和甲基化。在一个实施例中,该接头被生物素化,并与未生物素化的片段化产物连接,生物素的存在有利于构建的测序文库的分离纯化。在另一个实施例中,该接头被甲基化,并与未甲基化的片段化产物连接,然后用仅切割甲基化DNA的限制性内切酶消化成功连接的连接产物,从而确保酶切产物的单一性。接头元件的结构形式也有多种,包括但不限于平末端接头、突出末端接头、带茎环结构的接头和分叉接头。构建测序文库过程中可以只使用一种或同时使用多种接头。其中,突出末端接头、带茎环结构的接头和分叉接头均能够有效防止在连接过程中,多个接头自连现象的发生。针对接头的上述接头形式,以下将提供多个实施例。在第一实施例中,接头元件采用平末端接头,所述平末端接头是双链完全互补的核酸分子。在第二实施例中,接头元件采用突出末端接头,所述突出末端接头是双链核酸分子,该双链核酸分子至少包括一突出末端。该突出末端的碱基数无具体限制,优选为I 10 个碱基。根据该双链核酸分子的结构,可分成两类,分别是单突出末端接头、双突出末端接头。
如图2所示的单突出末端接头,其一端为平末端,另一端为突出末端。其中带有分叉接头的单突出末端接头能够防止接头自连。为了防止一端为平末端的单突出末端接头自连,可对平末端上的3’ OH进行修饰(包括但不限于用氨基封闭羟基),或将平末端上的5’ 磷酸基团去除。如图3所示的双突出末端接头,其含有两个突出末端,这两个突出末端可在一条核苷酸链上(图3a)或在不同的核苷酸链上(图3b)。当这两个突出末端在不同的核酸链上时,他们相互之间不互补,以防在连接时出现接头自连。在第三实施例中,接头元件采用带茎环结构的接头,所述带茎环结构的接头(如图4所示)为单链核酸分子,该单链核酸分子包括第一互补配对区I、茎环区2和第二互补配对区3 (图4a),第一互补配对区I能够与第二互补配对区3互补配对,且它们形成的互补配对区包括至少一个限制性内切酶识别位点,而通过该酶切识别位点,特定的酶能够将茎环区切开或切除,从而将单链核酸分子变成双链核酸分子,以便于后续的操作。在本发明的一个实施例中,如图4b所示,带茎环结构的接头还可带有突出末端4,该突出末端可位于单链核酸分子的5’端或3’端。突出末端4的存在能够进一步的防止接头自连现象的发生。 该关出末〗而优选为T。在第四实施例中,接头元件采用分叉接头,所述分叉接头是双链核酸分子,如图5 所示,包括互补区和分叉区,所述分叉区的两条单链各包含至少一个扩增引物结合位点。在本发明的一个实施例中,所述分叉接头的互补区包括至少一个限制性内切酶识别位点,该酶切识别位点可以在建库过程中酶切形成末端,以便于进行后续的操作。该分叉接头的分叉设计能够在建库过程避免多个接头自连现象的出现;所述分叉区上包含的扩增引物结合位点,可以直接用于结合扩增引物,进行扩增反应。其中,所述分叉接头的分叉区的每条链各含有M个核苷酸;优选的,9 SMS 30。 其中,所述分叉接头的配对区互补配对的核苷酸对数不限;优选的,互补配对的核苷酸对数为7 15,更优选的,互补配对的核苷酸对数为9 13。其中,所述分叉接头的配对区的3’末端为突出末端或平末端。优选的,所述分叉接头的配对区的3’末端为突出末端,该突出末端可与所述片段化产物的粘性末端互补配对, 提闻了连接效率,以利于构建测序文库反应的顺利进行。更优选的,所述分叉接头为T末端分叉接头,该接头的配对区的3’末端为突出末端,且突出末端最后Iv喊基为T ;例如图6所不的T末端分叉接头,图中N为A、T、C、G喊基中的任一种。更优选的,所述分叉接头的配对区的3’末端为突出末端,且突出末端的核苷酸包括通用碱基;例如图7所示的分叉接头,图中N为A、T、C、G碱基中的任一种,X为通用碱基。优选的,所述分叉接头为双脱氧接头,该接头的配对区的3’末端为平末端,且3’ 末端最后一个核苷酸为带有双脱氧碱基的核苷酸;例如图8所示的双脱氧分叉接头,图中N 为A、T、C、G碱基中的任一种,dd表示该3’末端最后一个核苷酸为带有双脱氧碱基的胞嘧啶核苷酸。应当说明的是,上述接头元件只是部分实施例,对于本发明的保护范围不做任何具体的限制。关于步骤S12的实现方式CN 102586420 A
在一个实施例中,步骤S12采用接头元件与扩增产物直接连接的方式,构建出测序文库。在另一个实施例中,根据高通量测序技术的需要,当目标区域扩增产物较大时或者需要构建的目标区域测序文库较小时,则对扩增产物进行片段化处理之后,再与接头元件进行连接,构建测序文库,如图9所示,步骤S12包括以下步骤S121.对与所述多个目标区域对应的扩增产物进行片段化,得到片段化产物;S122.利用接头元件,与片段化产物进行连接,构建测序文库。该步骤通过片段化处理,将不同的扩增产物变成长短相似的片段化产物,能够有助于后续的统一测序。需要说明的是步骤S121中,所述片段化扩增产物的方法有多种,可以根据需要选择采用现有技术,包括但不限于雾化、超声破碎、机械剪切破碎片段化、酶切片段化、化学以及热诱导片段化。所述片段化处理之后还可包括片段化产物的分离纯化以及末端修饰的步骤。根据测序的片段长度需要,对于片段化得到的核酸片段,进行目的核酸片段的分离纯化,分离方法可以采用常用方法,如凝胶电泳、蔗糖梯度或氯化铯梯度沉降、柱层析分离等。根据所使用的片段化方法,对所得的目的核酸片段进一步的末端修饰,包括但不限于磷酸化或去磷酸化、末端补平和末端加A,以便于后续的接头元件连接。上述目的核酸片段长短不限,优选为25bp 500bp,更优选为30bp 200bp,更优选为40 lOObp。在实现对乳腺癌易感基因的测序的前提下,随着测序文库分子中含有的乳腺癌易感基因片段长度的减短,高通量测序技术的对乳腺癌易感基因的测序深度加深;而测序深度越深,即对乳腺癌易感基因的每一个碱基位置的测序次数越多,测序结果越准确,对样品中的少量突变的检测就越灵敏; 这样就能够有效防止因为样品中带有突变的乳腺癌易感基因的比例偏低,而导致该突变的测序信号的绝对值偏低,发生测序结果不准确的现象。根据上述接头元件,针对步骤S122,本发明给出不同实施例。在本发明的一个实施例中,直接在片段化产物的两端接上接头形成测序文库。所述接头可采用上述的平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。在本发明的另一个实施例中,直接在片段化产物两端接上分叉接头,形成测序文库。本技术方案可以利用分叉接头的特性,防止多个接头之间自连现象的发生。在本发明的另一个实施例中,如图10所示,步骤S122具体可由以下步骤实现S1221.利用第一接头与片段化产物的两端连接,得第一连接产物;S1222.环化第一连接产物,得环化产物;S1223. II s型限制性内切酶酶切环化产物,得酶切产物;S1224.在酶切产物两端接上第二接头和第三接头,得测序文库。步骤S1221中,所述第一接头可采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的一种,所述第一接头包含有II S型限制性内切酶酶切识别位点;所述的 II s型限制性内切酶为切割位点在识别序列之外的限制性内切酶,包括但不限于Acu I、 Alw I、Bbs I、BbV I、Bcc I、BceA I、BciV I、BfuA I、Bmr I、Bpm I、BpuE I、Bsa I、BseM
11II、BseR I、Bsg I、BsmA I、BsmB I、BsmF I、BspCN I、BspM I、BspQ I、BtgZ I、Ear I、Eci
I、EcoP15 I、Fau I、Fok I、Hga I、Hph I, HpyAV, Mbo II、Mly I、Mme I、Mnl I, NmeAIII, Ple I、Sap I、SfaN I 和 TspDT I,优选为 Acu I、Bsg I、EcoP15 I 或 Mme I。若片段化产物经过末端修复酶修复,以及末端加A反应,所述第一接头优选为带T 末端的分叉接头。若片段化产物只是经过末端修复酶修复,将片段化产物的末端补平,则所述第一接头优选双脱氧接头。当所述第一接头为分叉接头时,该II s型限制性内切酶酶切识别位点位于互补区;当所述第一接头为带茎环结构的接头时,限制性内切酶识别位点与茎环结构之间的距离,较II S型限制性内切酶酶切识别位点与茎环结构之间的距离近。步骤S1223中,利用能够识别第一接头上的酶切识别位点,并切割环化产物(DNA) 但不切割第一接头的酶进行酶切。所述第一接头上的酶切识别位点包括但不限于=Mme I酶切识别位点、Acu I酶切识别位点、Bsg I酶切识别位点。步骤S1224中,所述弟_■接头可为平末〗而接头、关出末〗而接头、带环结构的接头和分叉接头中的一种,可带有生物素标记。所述第三接头可为平末端接头、突出末端接头、 带茎环结构的接头和分叉接头中的一种。第二接头与第三接头可相同或不同。优选的,所述第二接头和第三接头相同,均为分叉接头。更优选的,所述分叉接头为T末端分叉接头或双脱氧分叉接头。应当说明的是,以上实施例仅为本发明中的几种具体实施方案,并不用以限制本发明的保护范围。需要特别说明的是,步骤S1222和S1223之间还可包括步骤滚环扩增环化产物, 得扩增后的环化产物,此步骤能够保证后续的酶切步骤S1223有足够的环化产物。其中,步骤S1221和S1222之间还可包括步骤利用扩增引物对第一连接产物进行扩增,得扩增产物。所述扩增引物分别与第一连接产物两端的接头序列互补。其中,所述第一接头优选为分叉接头。其中,所述互补区可包含至少一个酶切识别位点,所述分叉区的两条单链各包含至少一个扩增弓I物结合位点。其中,所述扩增弓I物优选为生物素化弓I物。其中,所述扩增引物带有至少一个特异性酶切识别位点。若扩增引物上所带的特异性酶切识别位点是尿嘧啶碱基,则步骤S1222中利用尿嘧啶特异性切除试剂进行酶切,然后再进行连接环化。若扩增引物所带特异性酶切识别位点为限制性内切酶识别位点,则步骤S1222中利用相应的限制性内切酶进行酶切,然后在进行连接环化。在本发明的另一个实施例中,如图11所示,步骤S122具体可由以下步骤实现S1221’ .利用第四接头与片段化产物连接,得第二连接产物;S1222’ . II s型限制性内切酶酶切第二连接产物,得带有第四接头的酶切片段;S1223’ .带有第四接头的酶切片段与第五接头连接,形成测序文库。步骤S1221’中,所述第四接头可采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的一种,所述第四接头包含有II S型限制性内切酶酶切识别位点;当所述第四接头为分叉接头时,该II s型限制性内切酶酶切识别位点位于互补区;当所述第四接头为带茎环结构的接头时,限制性内切酶识别位点与茎环结构之间的距离,较II s型限制性内切酶酶切识别位点与茎环结构之间的距离近。若片段化产物经过末端修复酶修复,以及末端加A反应,所述第四接头优选为带T末端的分叉接头。若片段化产物只是经过末端修复酶修复,则所述第一四接头优选双脱氧接头。步骤S1222’中,利用能够识别第四接头上的酶切识别位点,并切割环化产物 (DNA)但不切割第四接头的酶进行酶切。所述第四接头上的酶切识别位点包括但不限于 Mme I酶切识别位点、Acu I酶切识别位点、Bsg I酶切识别位点。 步骤S1223’中,所述弟五接头可为平末纟而接头、关出末纟而接头、带环结构的接头和分叉接头中的一种,可带有生物素标记。在本发明的另一个实施例中,步骤S122具体包括以下步骤S1221”.直接在片段化产物的两端接上带茎环结构的接头,形成带茎环结构的片段化产物;S1222”.利用限制性内切酶,将带茎环结构的片段化产物的茎环区切开或切除,从而形成测序文库。本技术方案利用带茎环结构的接头,防止了多个接头自连现象的发生。应当说明,以上实施例仅为步骤S122的其中几种具体实施方案,并不用以限制本发明的保护范围。其中,步骤S2所述的单分子扩增是指对测序文库中的每个分子,以极微量(甚至单分子)的形式在空间上隔离(但这些文库分子整体上还是属于同一个反应体系),并且在各自的空间内实现扩增,以提升各种分子在后续测序反应中的信号。所述单分子扩增的方法包括但不限于乳液PCR(Emulsion PCR, EPCR)、桥式PCR。所述EPCR将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。 理想状态下,每个小水滴只含一个DNA模板(测序文库分子)和一个磁珠,磁珠上含有与测序文库分子的共有序列(由接头元件引入)互补的引物,在PCR反应后,磁珠表面就固定有拷贝数目巨大的同来源的DNA模板扩增产物。EPCR具体步骤可参考文献=BEAMing single-molecule PCR on microparticles in water—in—oil emulsions, Frank Diehl, Meng Li, Yiping He, nature methods, Vol. 3, No. 7,July 2006。所述桥式PCR的基本原理是,桥式PCR的引物被固定在固相载体上,PCR过程中 PCR扩增产物会被固定在固相载体上,且PCR扩增产物能够与固相载体上的引物互补配对,成桥状,然后互补配对的引物以与其成桥的扩增产物为模板进行扩增。通过控制初始模板加入的量,桥式PCR反应完成后,扩增产物在固相载体上以一簇簇的形式存在,且每一簇的扩增产物为同来源的DNA模板扩增产物。其具体的原理和实施方案可参考以下文献 CN20061009879. X、US6227604。如前所述,现有技术中,Sanger测序法由于自身的技术限制,每次只能对一个样品的某一段区域进行测序,检测效率低、成本高。为了一次性实现对样品中多个区域的同时检测,本发明在测序方法上采取高通量基因测序方法。高通量基因测序相对Sanger测序法检测序列信息更为高效、方便灵敏且成本低,测序文库中的各个分子经过单分子扩增后,每个测序文库分子均形成单分子拷贝阵列,各单分子拷贝阵列在进行高通量基因测序时处于不同的位置,使得测序引物与单分子拷贝阵列之间的杂交,以及在酶作用下的延伸反应可同时进行,相互之间互不干扰。因此,可以同时对大量的(成百万上千万,甚至更多的)单分子拷贝阵列同时进行测序反应,然后通过采集相应的信号,进而准确的获得所需的序列信息, 且测序的灵敏度较Sanger更高。尤其是对多个目标区域的扩增产物进行了片段化处理,相当于对相同序列的目标区域分子的每个碱基的测序次数增加了,能够进一步提高测序的灵敏度。其中,步骤S3所述高通量测序技术包括但不限于基于聚合酶的合成测序法和基于连接酶的连接测序法。合成测序法是基于带可去除标记的核苷酸进行的,在每次合成反应中,每个模板链至多只能延伸一次。一种合成测序法的大致流程如下a.测序引物通过互补配对结合在单分子扩增产物共有的已知序列上(该单分子扩增产物固定在引物-固相载体复合物上),在DNA聚合酶的作用下,以带可去除标记的核苷酸进行单碱基延伸合成反应,收集该次加入核苷酸的标记信号,即可得到与测序引物3’ 最末端碱基互补的单分子扩增产物(固定在引物-固相载体复合物上)的下一位的碱基序列信息。b.切除可去除标记,然后在DNA聚合酶的作用下,以带可去除标记的核苷酸继续进行单碱基延伸合成反应,收集加入核苷酸的标记信号,即可得到与测序引物3’末端碱基互补的单分子扩增产物的下两位的碱基序列信息。重复b步骤,直至不能继续进行合成反应为止,从而获得单分子扩增产物的全部序列信息。一种连接测序法是基于带有荧光标记的寡核苷酸探针进行的,该寡核苷酸探针带有η个碱基,分为h(h ( η)组,同一组寡核苷酸探针的不同荧光标记对应同一特定位置的不同碱基序列,不同组之间的区别在于不同荧光标记对应的特定位置不同,因为该寡核苷酸探针的3’端进行了特定的修饰,寡核苷酸探针之间不能直接相互连接,每次连接反应,每个单分子扩增产物只能连接一个寡核苷酸探针。该连接测序法的大致流程如下a.测序引物通过互补配对结合在单分子扩增产物共有的已知序列上(该单分子扩增产物固定在引物-固相载体复合物上)上,利用上述寡核苷酸探针中的一组(荧光标记对应的碱基位置为x,x < h),在连接酶的作用下,将核酸探针与上述寡核苷酸链连接,然后采集荧光信号,即可得到与单链扩增产物共有的已知序列的3’末端后或5’末端前第X 位碱基序列信息,将测序引物及其所连接的寡核苷酸探针从单分子扩增产物上变性洗脱下来。b.然后重新将测序引物结合在单分子扩增产物上,换用与a步骤不同的寡核苷酸探针组(荧光标记对应的碱基位置为1,I ( h),在连接酶的作用下,将核酸探针与上述寡核苷酸链连接,然后采集荧光信号,即可得到与单链扩增产物共有的已知序列的3’末端后或5’末端前第y位碱基序列信息,将测序引物及其所连接的寡核苷酸探针从单分子扩增产物上变性洗脱下来。C.重复步骤b,直至h组寡核苷酸探针均分别进行过一次连接反应,从而获得单分子扩增产物共有的已知序列的3’末端后或5’末端前第1、2.......h位的碱基序列信息。换用与之前的测序引物相比3’末端或5’末端多一个或多个通用碱基的引物按上述原理进行反应,能够延长获得的单分子扩增产物共有的已知序列的3’末端后或5’末端前的碱基序列的读长。这种基于连接酶的连接测序法的原理和具体实施方案可参考CN200710170507. I。基于聚合酶的合成测序法与焦磷酸测序法有一定的相似之处,因此,理论上来说, 焦磷酸测序法同样能够适用于本发明的检测方法。但是现有的焦磷酸测序法在测序过程中采用的是天然dNTP,使得其在测序过程中,对待测序文库上可能存在的连续单碱基重复序列的测定存在困难;而基于聚合酶的合成测序法中的核苷酸带有的可去除标记,能够保证每次只延伸一个碱基;基于连接酶的连接测序发中的带荧光标记的探针的3’端或5’端进行了修饰,保证每个单分子扩增产物的片段上只连接一个荧光探针;因此本发明的基于聚合酶的合成测序法和基于连接酶的连接测序法的准确性较焦磷酸测序高。此外,现有的焦磷酸测序仪器中的蚀刻光纤玻片(PTP板)上的小孔较大 (55 UmX 44 μ m),用于容纳测序之前的乳液PCR所得的扩增产物(乳液PCR的扩增产物被固定在10 μ m的珠上),这大大限制了焦磷酸测序法的测序通量,使得其测序反应的试剂成本较高。此外,焦磷酸测序法在测序过程中还需往蚀刻光纤玻片(PTP板)的小孔内加入含有多种蛋白的复合物以保证测序反应的顺利进行,而这将大大提高测序反应的试剂成本。而基于聚合酶的合成测序法和基于连接酶的连接测序法可通过I μ m的磁珠或者玻片来固定单分子扩增的产物,使其通量更高,且除了需要带有可去除标记的核苷酸以及在3’端或5’端进行了修饰的荧光标记的探针外,所需的其他试剂无特殊要求,大大降低了测序反应的试剂成本。在获得相同数据量的前提下,基于聚合酶的合成测序法和基于连接酶的连接测序法的测序成本为焦磷酸测序法的2000分之一或更少。因此本发明方案中采用的是基于聚合酶的合成测序法或基于连接酶的连接测序法对单分子扩增产物进行测序。此外,GSTMl基因属于谷胱甘肽转移酶家族,主要作用为催化其活性基团谷胱甘肽与经一相代谢酶代谢活化而来的多种亲电子致癌物,促进其排出体外。若GSTMl基因缺失的个体编码其同工酶的功能消失,缺乏对上述毒物的解毒功能,从而增加诉诸对该类致癌物作用的敏感性。因此,为了乳腺癌易感性检测的更加准确与全面,在本发明给出了另一种更为准确和全面的检测乳腺癌易感基因的方法流程,如图12所示,该方法在图I所示方法的基础上增加了检测GSTMl基因缺失的步骤,具体包含以下步骤SI,.利用乳腺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增, 并基于扩增产物构建测序文库;S2’.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;S3’.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息,S4’ .利用GSTMl的扩增引物对待测样品进行PCR扩增,凝胶电泳检测GSTMl和 GSTTl基因的缺失情况。步骤S4’与步骤S3’、S2’、SI’无先后关系。本技术方案通过高通量基因测序技术检测乳腺癌易感基因,确定已知和未知突变位点,进行基因分型,同时还进行了 GSTMl基因的缺失情况检测,从而更加准确、全面的检测乳腺癌易感性。
需要说明的是,在本技术方案中,步骤SI’至S3’可参见之前实施例中的步骤SI 到S3,在此不作赘述。步骤S4’中所述GSTMl的特异性引物包括SEQ ID NO :9和SEQ ID N010、SEQ ID NO : 11和SEQ ID NO 12中的至少一对。步骤S4’中除扩增GSTMl基因的目标区域之外,还包括对内参基因目标区域的扩增,所述内参基因的特异性引物为SEQ ID N0:13和SEQ ID NO :14。本发明提出的一个实施例中,同时检测乳腺癌易感基因中的FGFR2、GSTPU MTHFR 以及GSTMl基因。针对FGFR2、GSTPU MTHFR的热点突变区域设计相应的特异性引物F1F(SEQ ID NO: I)和 FlR (SEQ ID NO 2) ,GIF (SEQ ID NO 3)和 GlR (SEQ ID NO 4) ,MlF (SEQ ID NO 7)
MlR(SEQ ID NO 8);同时设计检测GSTMl基因确实的特异性引物G2F (SEQ ID NO 9)和 G2R(SEQ ID NO :10),以及内参基因的特异性引物 M2F (SEQ ID NO :13)和 M2R(SEQ ID NO: 14)。一、待测样品中DNA的提取利用市场上常见的核酸提取试剂盒分别提取全血样品(I至10)、血清样品(11至
20)、石蜡组织样品(21至30)的DNA,并分别进行标记。二、待测乳腺癌易感基因多个目标区域的扩增利用上述待测易感基因的特异性扩增引物,对乳腺癌易感基因的目标区域进行扩增,得到扩增产物。上述待测易感基因的目标区域扩增分别进行,反应体系如下上游引物(10μ Μ)2μ L ;下游引物(10μ Μ)2μ L ;dNTP(各 2.5mM)4μ L ;待测样品DNA20ng ;Ex Taq (5U/ μ L)0. 25 μ L ;IOXEx Taq Buffer 5 μ L ;ddH20 加至 50yL。PCR反应条件如下95 °C 3min ;94°C 30s, 58°C 30s,72°C 30s ;重复 25 个循环;72 °C 7min。利用PCR回收试剂盒,分别对各样品的扩增产物进行分离,除去未扩增的引物和 dNTP,回收扩增产物。三、利用扩增产物构建测序文库根据之前所述,本步骤可由多种方式实现。在本发明的一个实施例中,采用在片段化产物两端直接连上接头元件的方法构建测序文库,具体包括I.扩增产物的片段化本实施例中采用超声破碎法进行片段化处理,具体操作为测定回收后的扩增产物浓度,按等摩尔数将相同样品的不同乳腺癌易感基因目标区域扩增产物进行混合,得混合液,并标记加以区别。
将每个样品的混合液50yL加入至400yL的TE buffer中,430W功率条件下超声 4s,间隔10s,反复5次,得到片段混合物。利用I %琼脂糖凝胶进行分离纯化,选择40-100bp 大小的片段切胶回收,得到片段化产物。2.利用片段化产物与接头元件构建测序文库为便于进行接头元件的连接,对片段化产物进行末端修饰。本实施例中,分别进行磷酸化、末端补平及加A尾反应,具体操作如下I)磷酸化以及末端补平反应体系为片段化产物约2000ng ;IOmMdNTPI. 5μ L ;T4DNA 聚合酶(5U/ μ L)I μ L ;Klenow DNA 聚合酶O. I μ L ;Τ4 多核苷酸激酶(10U/ μ L)O. 5 μ L ;IOm MATPI. 5μ L ;Τ4 DNA 连接缓冲液10 μ L ;加ddH20 至 100 μ L。20°C孵育20min,反应结束后利用回收试剂盒进行纯化回收。2)末端加A尾反应体系为磷酸化以及末端补平后的回收产物约IOOOng;Klenow 缓冲液(NEB Buffer2)10 μ L ;IOmM dATP2μ L ;Klenow 酶(3,to 5,exo minus, IOU/ μ L) I μ L ;力口ddH20 至 100μ L。37°C孵育30min,反应结束后利用纯化试剂盒纯化回收。3)连接接头I本实施例中采用如图6所示T末端分叉接头作为接头1,同一样品使用相同T末端分叉接头,不同样品对应不同T末端分叉接头,根据其上所带第一标签序列进行区分,不同样品对应的标签序列如下表I所示。表I.第一标签序列数据表
权利要求
1.一种检测乳腺癌易感基因的方法,其特征在于,所述方法包括以下步骤A.利用乳腺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,并基于扩增产物构建测序文库;B.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;C.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息。
2.根据权利要求I所述的检测乳腺癌易感基因的方法,其特征在于,所述步骤A包括: Al.利用乳腺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,得到与所述多个目标区域对应的扩增产物;A2.利用接头元件,与所述多个目标区域对应的扩增产物进行连接,得到测序文库;所述接头元件采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。
3.根据权利要求2所述的检测乳腺癌易感基因的方法,其特征在于,所述步骤A2包括以下步骤A21.对与所述多个目标区域对应的扩增产物进行片段化,得到片段化产物;A22.利用接头元件,与所述片段化产物进行连接,构建测序文库。
4.根据权利要求3所述的检测乳腺癌易感基因的方法,其特征在于,所述步骤A22包括以下步骤A221.利用第一接头与片段化产物的两端连接,得第一连接产物;A222.环化第一连接产物,得环化产物;A223. II s型限制性内切酶酶切环化产物,得酶切产物;A224.在酶切产物两端接上第二接头和第三接头,得测序文库。
5.根据权利要求3所述的检测乳腺癌易感基因的方法,其特征在于,所述步骤A22包括以下步骤Α22Γ .利用第四接头与片段化产物连接,得第二连接产物;A222’ . II s型限制性内切酶酶切第二连接产物,得带有第四接头的酶切片段;A223’ .带有第四接头的酶切片段与第五接头连接,得测序文库。
6.根据权利要求2至5任一项所述的检测乳腺癌易感基因的方法,其特征在于,步骤 A2所述接头元件中的至少一个接头包含有第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库进行标记。
7.根据权利要求I至5任一项所述的检测乳腺癌易感基因的方法,其特征在于,步骤A 中所述的乳腺癌易感基因有多个,每个乳腺易感基因的目标区域对应的特异性引物中的至少一条与该目标区域部分互补,且该引物的5’端带有第二标签序列,用于在文库构建过程中,对不同待测样品的测序文库进行标记。
8.根据权利要求5所述的检测乳腺癌易感基因的方法,其特征在于,所述待测易感基因包括FGFR2、GSTPl、IL-I β、和MTHFR中的至少一个。
9.根据权利要求I所述的检测乳腺癌易感基因的方法,其特征在于,所述方法还包括步骤D.利用GSTMl的特异性扩增引物对待测样品进行PCR扩增,凝胶电泳检测GSTMl基因的缺失情况;步骤D与步骤A、B或C之间均无先后顺序关系。
10.一种乳腺癌易感基因检测试剂盒,其特征在于,所述试剂盒包括乳腺癌易感基因特异性引物,用于对待测样品中的多个目标区域进行扩增;接头元件,用于与扩增产物结合构建测序文库。
11.根据权利要求10所述的乳腺癌易感基因检测试剂盒,其特征在于,所述接头元件采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。
12.根据权利要求10所述的乳腺癌易感基因检测试剂盒,其特征在于,所述接头元件中的至少一个接头包含有第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库进行标记。
13.根据权利要求10所述的乳腺癌易感基因检测试剂盒,其特征在于,所述乳腺癌易感基因有多个,与每个目标区域对应的特异性引物中至少有一条引物与目标区域部分互补,且该引物的5’端带有第二标签序列,用于在扩增目标区域过程中,对不同待测样品的目标区域扩增产物进行标记。
14.根据权利要求10至13中任一项所述的检测乳腺癌易感基因的试剂盒,其特征在于,所述乳腺癌易感基因包括FGFR2、GSTPl、IL-I β、MTHFR和GSTMl中的至少一个。
全文摘要
本发明涉及基因工程领域,提供一种检测乳腺癌易感基因的方法及试剂盒。所述检测乳腺癌易感基因的方法包括以下步骤A.利用乳腺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,并基于扩增产物构建测序文库;B.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;C.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息。本发明提供的检测乳腺癌的方法及试剂盒,能对乳腺癌易感基因的多个区域同时进行检测,提高了检测效率,降低了检测成本,此外还提高了检测灵敏度以及检测结果的全面性和准确性。
文档编号C12Q1/68GK102586420SQ20111044515
公开日2012年7月18日 申请日期2011年12月27日 优先权日2011年12月27日
发明者盛司潼 申请人:盛司潼
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1