本发明涉及基因检测,尤其涉及一种乳腺癌基因检测的探针组合物和试剂盒。
背景技术:
1、乳腺癌是全球女性最常见的恶性肿瘤,所有乳腺癌患者中约有5-10%的患者具有遵守孟德尔遗传方式的家族史,这部分乳腺癌被称为遗传性乳腺癌,被认为是由单个基因导致的,现代基因检测手段发现约50%的遗传型乳腺癌是由brca1/2突变所导致的,其它致病基因还包括check2,atm以及palb2等。对具有家族史的乳腺癌患者,美国国家综合癌症网络(the national comprehensive cancer network,nccn)会定期发布临床癌症诊疗指南,推荐进行brca1/2基因检测或涵盖大约20个基因的多基因芯片检测。
2、目前已知的遗传性乳腺癌致病基因大部分直接参与到dna的损伤修复中,同时,散发性乳腺癌中也有40%具有dna同源重组修复通路缺陷,因此基因组不稳定性是乳腺癌的一个关键分子特征,而结构变异直接表现出基因组的不稳定性。结构变异(svs),包括插入、删除、复制、倒位和易位,相比较单核苷酸变异(snvs)对基因组的影响程度,结构变异产生更大改变。在以往的研究中发现,结构变异是一种常见变异,已知有些特定的变异会导致遗传疾病和癌症。以往关于结构变异对基因结构和表达的影响的研究,大大加深了我们对肿瘤发生的认识。许多致癌基因已被证明是染色体易位的产物,并可作为治疗的靶点。
3、常见的结构变异包括:
4、sanger测序:检测已知基因变异位点,设计特异性引物对目标区域基因扩增后测序,优点是准确度高,缺点是无法检测未知变异,检测通量低。
5、原位荧光杂交(fish)技术:设计乳腺癌基因的荧光探针,同待检测的组织细胞的细胞核进行杂交后显色,观察细胞中探针的杂交显色情况。该方法单次可检测基因的数量受限于荧光基团发光类型,根据发光颜色来区分不同基因,只能针对已知变异设计探针进行检测。且对样本要求较高,操作繁琐,结果判读不易观察判读。
6、基因芯片技术:将大量预先制备的dna探针以显微打印的方式有序地固化于支持物表面,然后与带有荧光标记的样品杂交。确定荧光强度最强的探针位置,获得一组序列完全互补的探针序列。只能检测已知基因变异,无法检测复杂结构变异(svs)情况。
7、二代测序技术:现有的二代测序检测技术读长短、pcr扩增偏好性的限制,在肿瘤基因组中识别复杂的svs仍然具有挑战性,无法避免较高的假阴性率。二代测序仅能对35%的家族性乳腺癌患者的致病突变进行鉴定,其余大部分家族性乳腺癌仍无法知悉其致病基因突变,因而也无法进行后续的风险管理。
8、三代全基因组测序技术:二代测序无法获得乳腺癌基因复杂结构变异(svs)信息,但利用三代长读长测序技术有效检出,该技术在检测结构变异方面都表现出较高的敏感性和特异性。同时也能检测基因中的检测单核苷酸变异(snvs)。但是该方法由于是对全基因组测序的方案,乳腺癌基因数据只占很小一部分,其余数据对乳腺癌基因的检测无意义,该方法需要一次或多次测序才能完成1个样本的检测,在时间、通量和成本上制约了乳腺癌基因检测的大规模临床应用。且超大的数据量对后续的数据分析处理能力提出了极高的要求。
技术实现思路
1、有鉴于此,本发明要解决的技术问题在于提供一种乳腺癌基因检测的探针组合物和试剂盒,该探针组利用三代测序技术,能够对针对乳腺癌基因实现良好的筛查,从而降低检测所需的成本和时间。
2、本发明提供了乳腺癌诊断探针组,其包括靶向如下标志物中至少一种的探针:
3、erbb4、rad51b、esr1、nf1、fancc、egfr、brip1、atm、wrn、esr2、pgr、blm、cdh1、mre11、pik3ca、rad50、brca2、bard1、brca1、chek2、nbs1、rad51c、erbb2、recql5、palb2、erbb3、rad51d和recql4。
4、本发明中,所述探针组中,每条探针的长度为50~130bp,参照人类参考基因组版本hg38设计。
5、本发明中,每条探针平均间隔500bp。
6、所述atm基因的检测探针靶向chr11:108222232~chr11:108369359之间;
7、所述bard1基因的检测探针靶向chr2:214725368~chr2:214809988之间;
8、所述blm基因的检测探针靶向chr15:90717185~chr15:90816306之间;
9、所述brca1基因的检测探针靶向chr17:43044252~chr17:43170329之间;
10、所述brca2基因的检测探针靶向chr13:32314848~chr13:32400373之间;
11、所述brip1基因的检测探针靶向chr17:61679001~chr17:61864121之间;
12、所述cdh1基因的检测探针靶向chr16:68737106~chr16:68835226之间;
13、所述chek2基因的检测探针靶向chr22:28688022~chr22:28742642之间;
14、所述egfr基因的检测探针靶向chr7:55018762~chr7:55211883之间;
15、所述erbb2基因的检测探针靶向chr17:39687609~chr17:39730729之间;
16、所述erbb3基因的检测探针靶向chr12:56078013~chr12:56103712之间;
17、所述erbb4基因的检测探针靶向chr2:211375625~chr2:212539246之间;
18、所述esr1基因的检测探针靶向chr6:151656594~chr6:152129714之间;
19、所述esr2基因的检测探针靶向chr14:64084565~chr14:64338700之间;
20、所述fancc基因的检测探针靶向chr9:95098855~chr9:95426984之间;
21、所述mre11基因的检测探针靶向chr11:94415321~chr11:94512441之间;
22、所述nbs1基因的检测探针靶向chr8:89933302~chr8:90003341之间;
23、所述nf1基因的检测探针靶向chr17:31007684~chr17:31382286之间;
24、所述palb2基因的检测探针靶向chr16:23602948~chr16:23641568之间;
25、所述pgr基因的检测探针靶向chr11:101029335~chr11:101130955之间;
26、所述pik3ca基因的检测探针靶向chr3:179148043~chr3:179240163之间;
27、所述rad50基因的检测探针靶向chr5:132555873~chr5:132645514之间;
28、所述rad51b基因的检测探针靶向chr14:67819688~chr14:68730308之间;
29、所述rad51c基因的检测探针靶向chr17:58692263~chr17:58734994之间;
30、所述rad51d基因的检测探针靶向chr17:35092054~chr17:35121674之间;
31、所述recql4基因的检测探针靶向chr8:144511004~chr8:144518123之间;
32、所述recql5基因的检测探针靶向chr17:75626707~chr17:75667327之间;
33、所述wrn基因的检测探针靶向chr8:31033028~chr8:31175648之间。
34、本发明对探针序列进行筛选,筛选获得了效果更好的探针组合,通过精心设计乳腺癌基因的长片段捕获扩增技术与三代长读长测序技术联用,实现了低成本、高通量、短周期的乳腺癌相关基因的基因变异(snvs、svs)全覆盖式筛查。
35、本发明还提供了乳腺癌诊断试剂,其包括所述的探针组和建库试剂。
36、所述乳腺癌诊断试剂还包括接头a、接头b、预扩增引物;
37、所述接头a序列为:
38、gcagtcgaacatgtagctgactcaggtcac(n)xggtagt;
39、所述接头b序列为:
40、ctacc(n)x gtgacctgagtcagctacatgttcgactgc;
41、所述接头b的5’端经磷酸化修饰,(n)x中,n为a、g、c、t四种碱基中的任意一种,x的数量为10~20;
42、所述预扩增引物的序列为:gcagtcgaacatgtagctgactcaggtcac。
43、作为优选,所述x的数量为16。针对同一个样品,接头a和接头b中的(n)x反向互补。
44、本发明中,所述建库试剂包括:dna打断试剂、末端修复试剂及加接头试剂,文库预扩增试剂、杂交捕获试剂和杂交洗脱试剂。
45、进一步的,本发明还提供了如前所述的探针组、所述的乳腺癌诊断试剂在制备乳腺癌诊断产品中的应用。
46、本发明还提供了乳腺癌测序文库构建方法,其以如前所述的乳腺癌诊断试剂进行构建,具体包括:
47、将基因组dna打断后,经末端修复,加上所述接头a和接头b,获得文库溶液;
48、将文库溶液以所述预扩增引物进行扩增后,以所述的探针组进行捕获,然后以磁珠进行富集。
49、乳腺癌测序文库,其由如前所述的构建方法构建获得。
50、本发明所述的构建方法中,所述基因组dna为人类基因组dna。所述人类基因组dna提取自外周血。
51、本发明还提供了乳腺癌的诊断方法,其包括以如前所述构建方法获得的测序文库进行测序,根据结果进行数据分析。
52、所述测序采用pacbio sequel ii。
53、所述数据分析包括数据质控及拆分、去重复及比对和变异检测。
54、本发明通过精心设计乳腺癌基因的长片段捕获扩增技术与三代长读长测序技术联用,实现了低成本、高通量、短周期的乳腺癌相关基因的基因变异(snvs、svs)全覆盖式筛查。本法明提升了乳腺癌基因结构变异的检出率及大规模筛查的临床可及性:1.克服二代测序检测技术对乳腺癌基因结构变异检测不全面导致的假阴性问题;2.解决了用三代全基因组测序检测乳腺癌基因成本高、通量小的、不便普及的困难,具有显著的临床推广应用价值。