一个用于筛查突变基因的609基因panel的制作方法

文档序号:15514744发布日期:2018-09-25 17:33阅读:3420来源:国知局

本申请属于基因检测领域,具体涉及突变基因的检测。



背景技术:

人类有2万多个基因,31.6亿个碱基对,我们要研究哪些基因哪些位点与人类肿瘤有密切相关性,是一件很复杂、任务庞大的事情,国内基因检测公司针对不同的肿瘤与检测目的,各家公司对于panel的选取,出现了百花齐放百家争鸣的现象。但是如果panel的基因选取不当,基因位点或者区域选取不当,错失重要位点的信息,对患者不能起到针对性的检查,增加患者的成本但没有指导作用,给临床医生的早期诊断提供错误的信息。所以,基因panel的选取尤为关键。

最相近似的实现方案:2017年11月15日,美国fda正式批准了美国最好的癌症中心之一---纪念斯隆凯特琳癌症中心(memorialsloanketteringcancercenter,简称msk)的ngs肿瘤多基因分析检测平台impacttm(integratedmutationprofilingofactionablecancertargets),可快速鉴定468个基因中的变异,以及基因组的其他分子变化情况,为后续治疗提供指导。他们利用独有的肿瘤检测技术msk-impacttm对超过10000名晚期癌症患者进行了基因测序,适用于多达63种实体肿瘤类型,这是目前转移性癌症患者中最大规模发肿瘤测序研究。msk-impacttm是一种基于ngspanel的杂交捕获技术,可快速检测与癌症相关的468个独特基因上的所有蛋白质编码突变、拷贝数变异、启动子突变以及结构重排。

小panel往往局限于针对突变位点的靶向药物,经济实惠,但可能错失其它靶向药物的位点,也缺少化疗药物毒副作用位点的检测。当小panel检测不能满足时,就需要选择检测位点更多的panel。而大panel检测位点全面,涵盖较多的靶向化疗药物,但从检测结果上来看,有一部分基因在医学上的作用尚未明确,和实际用药检测并不相关,很大一部分推荐的药物较难获取,往往造成了检测成本的浪费,对患者并没有指导作用且增加经济负担。

目前市场上的大panel一般可以检测500个左右的基因,检测成本高。



技术实现要素:

发明目的:解决市场上小panel检测不准确和大panel检测成本浪费缺点。

技术方案:一种用于筛查突变基因的609基因panel,其特征在于,包含有609个基因1273个位点,609个基因是通过有msk提供的样本中468个基因和48个中心的400多个驱动基因进行基因注释和加入用药位点信息进行筛选而得;这609个基因如下表所示:

表1

abl1abl2acacaacsl3acsl6actbactg1acvr1acvr1bacvr2aadam10adcy1aff4ahctf1ahnakahrakap9akt1akt2akt3alkalox12bamer1ank3ankrd11apaf1apcaqrararafarap3arfgap1arfgap3arfgef1arfgef2arhgap29arhgap35arhgef2arid1aarid1barid2arid4aarid4barid5barntlash1laspmasxl1asxl2atmatratrxaurkaaurkbaxin1axin2axlb2mbap1bard1bbc3bcl10bcl11abcl2bcl2l11bcl6bcorbirc3blmbmpr1abmpr2bnc2bptfbrafbrca1brca2brd4brip1brwd1btkcadcalrcard11carm1casp1casp8castcatcbfbcblccar1ccnd1ccnd2ccnd3ccne1cct5cd274cd276cd79acd79bcdc27cdc73cdh1cdk12cdk4cdk6cdk8cdkn1acdkn1bcdkn2acdkn2bcebpacep290chd1lchd3chd4chd6chd8chd9chek1chek2cicclockclspncltccnot3cntnap1col1a1crebbpcrklcrnkl1crtc3csde1csf1rcsf3rcsnk2a1ctcfctnnb1ctnnd1cttncul1cul3cux1cxcr4cylddaxxddr2ddx3xddx5depdc1bdhx15dhx35dhx9dicer1dis3dnajb1dnmt1dnmt3adnmt3bdot1le2f3eedeef1a1eftud2egfl7egfreif1axeif2ak3eif4a2eif4eeif4g1eif4g3elf3ep300epc1epha1epha2epha3epha4epha5epha7ephb1ephb2erbb2erbb3erbb4ercc2ercc3ercc4ercc5errfi1esr1etv1etv6ezh2f8fam175afancafancifasfat1fat2fbxo11fbxw7fgf19fgf3fgf4fgfr1fgfr2fgfr3fgfr4fhfkbp5flcnflt1flt3flt4fmr1fn1foxa1foxa2foxl2foxo1foxp1fusfxr1fyng3bp1g3bp2gata1gata3gna11gnai1gnaqgnasgng2gps2gpsm2grem1grin2agsk3bh3f3ah3f3bh3f3chcfc1hdac3hdac9hgfhist1h2bdhist1h3bhist1h3chist1h3dhist1h3ehist1h3fhist1h3ghist1h3hhist1h3ihist1h3jhist2h3dhist3h3hla-ahla-bhlfhnf1ahoxb13hrashsp90aa1hsp90ab1hspa8idh1idh2igf1igf1rigf2ikbkeil7ring1inhainhbainpp4ainpp4binppl1insrireb2irf2irf6irf7irs1irs2itga9itsn1jak1jak2jak3jmyjunkalrnkat6bkdm5akdm5ckdm6akdrkeap1kitklf4kmt2ckmt2dkraslama2lats2lcp1ldhalima1lmo1lnpeplrp6lrpprcmacf1magi2map2k1map2k2map2k4map3k1map3k11map3k13map3k14map3k4map4k1mapk1mapk3mat2amaxmcm3mcm8mdc1mdm2mdm4mecommed12med17med23mef2bmef2cmen1metmfngmgamgmtmitfmkl1mlh1mlh3mmp2mplmre11amsh2msh6msr1mst1mst1rmtormuc20mutyhmybmycmycnmyd88myh10myh11myh14myh9myod1nbnncf2nck1nckap1ncoa3ncor1ncor2ndrg1nedd4lnf1nf2nfatc4nfe2l2nfkbiankx2-1nkx3-1notch1notch2notch3notch4npm1nr2f2nr4a2nrasnsd1ntn4ntrk1ntrk2ntrk3nup107nup93nup98pabpc1pabpc3pak1palb2park2parp1pax5pbrm1pcbp1pcdh18pcsk5pcsk6pdcd1pdgfrapdgfrbper1pgrphf6pik3c2bpik3c2gpik3capik3cbpik3cdpik3cgpik3r1pik3r2pik3r3pim1plcb1plcg1plk2plxna1plxnb2pms1pms2polepolr2bpom121ppm1dppp2r1appp2r5appp2r5cppp6cprdm1prkar1aprkczprpf8prrx1psip1psma6psmd11psme3ptch1ptenptpn11ptprdptprfptprsptprtptprurab35rac1rad21rad23brad50rad51rad51brad51crad52rad54lraf1rararasa1rasgrp1rb1rbbp7rbm10rbm5recql4relretrfc4rfwd2rgs3rhebrhoarhot1rictorrit1rnf43robo2ros1rpl5rps6ka4rps6kb2rptorrtn4runx1rybpsdhasdhaf2sdhbsetd2setdb1sf3b1sfpqsh2b3sh2d1ashmt1shq1sin3asmad2smad3smad4smarca1smarca4smarcb1smarcd1smc1asmosmurf2socs1sos1sos2sox17sox2sox9spenspopsrcsrgap1srgap3srsf2stag1stag2stard13stat3stat5astat5bstip1stk11stk4stk40sufusuz12svep1syksyncriptaf1taok1tbl1xr1tbx3tceb1tcf12tcf3tcf4tcf7l2terttet2tfdp1tgfbr1tgfbr2thrap3tjp1tjp2tmem127tnfaip3tnpo1tom1top1tp53tp63traf7trerf1triotrip10tsc1tshrtxnipu2af1usp6vegfavhlvimvtcn1wasf3whsc1whsc1l1wipf1wnk1wnt5awt1xiapxpo1xrcc2xrn1yap1ybx1yes1zc3h11azfhx3zfp36l2znf292znf638

用于筛查突变基因的609基因panel筛选过程,

1)从msk提供的样本中选取与癌种相关的突变点信息,得到468个基因;

2)选取另外48个研究中心发表的样本数据,预测驱动基因,得到400多个驱动基因;

3)合并上面2部分的信息,对变异位点进行基因注释;

4)对上面选取的基因,加入用药位点的信息;

5)根据个人经验与参考数据库,对上面所有的位点信息筛选,最终保留609个基因1273个位点。

有益效果:

1)纪念斯隆凯特琳癌症研究中心(memorialsloanketteringcancercenter,简称msk)的基因panel可以覆盖接近300种癌种,我们的panel可以覆盖367个癌种,目前几乎没有覆盖这么多癌种的panel;

2)纪念斯隆凯特琳癌症研究中心(memorialsloanketteringcancercenter,简称msk)的基因panel有468个基因,我们精选了609个肿瘤相关基因,覆盖面更广,而且我们对这609个基因只选取最高发突变的位点,成本低,针对性强;

3)加入了fda批准的用药位点信息,对临床医生用药指导提供了帮助;

4)有609个基因,不仅覆盖了市场上的大panel的绝大部分基因,而且有针对性的选取每个基因的热点突变区域与用药位点,整体成本会下降,又可以了解肿瘤用药的全面信息。

具体实施方式

首先,我们根据纪念斯隆凯特琳癌症研究中心(memorialsloanketteringcancercenter,简称msk)在《自然医学》杂志上刊登的文章,下载了所有的临床研究样本与基因列表名单,对这些样本的突变信息进行挖掘提取有用的数据,并对肿瘤类型进行统计分析,得到468个基因262595个位点突变信息;

其次,选取了48个公开发表的研究中心上传的6000多例患者的高通量数据,在基因变异的基础上基于蛋白质,转录调控和非编码rna的生物分析网络做了拓扑结构分析和进一步筛选,得到400多个驱动基因48121个位点的突变信息;

最后,取这2部分基因的并集,对所有的突变位点进行注释,综合多个数据库的信息来判断与肿瘤相关的基因以及突变情况,从得到的8000多个突变信息中根据已有的经验选取高频突变基因与突变点,再加入这些基因已知的用药位点,最终确定609个基因1273个突变位点。如最后表所示。

chrom:染色体

pos:染色体上的位置

ref:参考染色体该位置上的碱基

alt:检测到该位置的碱基

ann[*].hgvs_p:annovar软件注释出来的hgvs(蛋白水平上的)命名

ann[*].hgvs_c:annovar软件注释出来的hgvs(dna水平上的)命名

ann[*].effect:annovar软件注释出来的突变类型

ann[*].rank:annovar软件注释出来该位置在对应的基因上的几号外显子上或者在内含子区间

ann[*].gene:annovar软件注释出来的基因

ann[*].featureid:注释所参考的转录本版本号

cosid:cosmic数据库中的id号

cds:编码序列的缩写

aa:氨基酸缩写

cnt:cosmic数据库中收录的样本有多少个样本是这种突变

exac_all:exac数据库中收录的所有样本在该位点的突变频率;

exac_ac_afr:exac数据库中收录的非洲人的样本在该位点的突变频率;

exac_ac_amr:exac数据库中收录的美国人的样本在该位点的突变频率;

exac_ac_eas:exac数据库中收录的东亚人的样本在该位点的突变频率;

exac_ac_fin:exac数据库中收录的芬兰人的样本在该位点的突变频率;

exac_ac_nfe:exac数据库中收录的非芬兰人的样本在该位点的突变频率;

exac_ac_oth:exac数据库中收录的非以上地区人种的样本在该位点的突变频率;

exac_ac_sas:exac数据库中收录的南亚人的样本在该位点的突变频率;

1000g_all:千人基因组数据库中收录的所有样本在该位点的突变频率;

1000g_eas_af:千人基因组数据库中收录的东亚人的样本在该位点的突变频率;

1000g_amr_af:千人基因组数据库中收录的美国人的样本在该位点的突变频率;

1000g_afr_af:千人基因组数据库中收录的非洲人的样本在该位点的突变频率;

1000g_eur_af:千人基因组数据库中收录的欧洲人的样本在该位点的突变频率;

1000g_sas_af:千人基因组数据库中收录的南亚人的样本在该位点的突变频率;

clinvar_clinsig:clinical数据库中收录的该位点变异的临床意义;

clinvar_clndbn:clinvar数据库中收录的与该位点相关的疾病信息;

fathmmprediction:cosmic数据库中对致病位点的预测

0fathmmscore:cosmic数据库中对致病位点打分,分数越高该位点越可能引起致病

mutationsomaticstatus:cosmic数据库中对该位点是体系突变或者胚系突变的预测

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1