基于染色体变异指数的新型早期肿瘤标记物及应用的制作方法

文档序号:12734482阅读:267来源:国知局
本发明涉及分子生物学和肿瘤学领域,涉及核酸定量、染色体变异以及肿瘤早期筛查和诊断。
背景技术
:中国每年有超过300万人罹患癌症,死亡超过200万人,肿瘤已成为我国非意外死亡的最大因素。目前晚期癌症没有行之有效的治疗措施,5年生存率在10%-40%之间。早期肿瘤可以通过根治性手术去除,五年生存率一般都在80%以上,因此早期筛查对于肿瘤治疗具有重要意义。肿瘤筛查可以在有症状前发现早期癌症,从而有效延长生存期和提高生活质量。研究证明结直肠镜和乙状肠镜通过发现并切除癌前息肉病变从而预防结直肠癌,因此专家建议50-75岁正常风险人群做内镜检查。低剂量螺旋CT可以有效降低55-74岁重度吸烟者的肺癌死亡率。对于44-74岁女性来说钼靶筛查乳腺癌同样可以提高生存率。Pap检测在女性宫颈癌防治中具有重要作用,可以有效的降低宫颈癌死亡率。除了通过仪器和病理检查,基于生物化学和分子生物学的肿瘤标志物检测也在肿瘤筛查中发挥重要作用,例如HPV检测之于宫颈癌,CA-125之于卵巢癌,PSA之于前列腺癌等。然而所有的筛查方法都非完美,由于敏感度和特异度局限,这些检测都会出现较大的假阳性和假阴性结果,肿瘤筛查还需要具有更高敏感度和特异度的肿瘤标记物和检测手段。结直肠癌(colorectalcancer,CRC)是人类发病率较高的恶性肿瘤之一,每年引发全球超过60万人次死亡。现阶段主要的筛查手段包括粪便隐血试验(FIT)、肠镜检测。随着结直肠癌筛查的普及,结直肠癌筛查的技术面临着许多科学问题。粪便隐血试验敏感性比较低,尤其是对癌前早期病变检测不够敏感;肠镜检查由于其创伤和复杂性阻碍了在人群中大规模推广,其结果是每年还是有许多的结肠直肠癌患者不能被早期诊断而遭受重症折磨。因此开发新的替代和补充性的大肠癌早期筛查方法有重要意义。近年来兴起的结直肠癌的分子检测技术提供了深受患者喜爱的无创检测方法[1]。无创检测的样本来自于血液、粪便和尿液等体液,检测的生物标记物包括蛋白、RNA和DNA等,而检出率主要依赖于标志物的性质、标志物释放到体液样本中的机制和浓度。理想的情况是分子标志物可以明确区分结直肠病变和正常组织,还要持续的释放进入待检测体液并有足够的浓度供检测。针对结直肠癌筛查目前主要有两种商业化的基因DNA甲基化分子检测方法:血清中检测septin9甲基化[2]和下一代粪便DNA检测[3]。在组织水平上septin9的异常甲基化可以明确区别结直肠病变和正常黏膜,从血浆中检测septin9甲基化筛查结直肠癌可以达到52%-73%的灵敏度和84%-91%的特异度[2,4-6]。下一代粪便DNA检测是从粪便DNA中检测肿瘤特异的多基因甲基化及KRAS突变,具有很高的结直肠癌和癌前病变检出率[3,7]。Imperiale,T.F.等通过9989例样本证实通过检测sDNA的NDRG4、BMP3异常甲基化和KRAS点突变以及血红蛋白含量可以达到92.3%的灵敏度和86.6%的特异度[8],目前此方法已得到FDA的批准上市。以上两种筛查结直肠癌的方法虽然都有比较高的灵敏度和特异度,但是对于I期和II期的早期肿瘤检测能力弱而且总体特异度不够高(小于90%)。特异性不高主要原因之一在于正常组织中也存在低频甲基化,不能完全区分出正常细胞和肿瘤细胞。肿瘤的产生和发展依赖于体细胞发生的遗传变异和表观遗传改变,其中包括点突变(SNV)、小片段插入缺失(InDel)、拷贝数改变(CNV)、甲基化改变、病毒感染和染色体重排等。拷贝数变化(CNV)在肿瘤细胞中极其常见,其中1号染色体和8号染色体臂的扩增和缺失在结直肠癌中普遍存在,而正常细胞中不存在大规模的CNV[9]。如果能够在血浆中准确检测到由肿瘤细胞释放的非整倍染色体,那么可以高特异性和高敏感度的检测到肿瘤。在血浆中检测染色体变异由来已久,其中应用最为广泛的是利用高通量测序取孕妇外周血浆无创筛查胎儿的21号染色体三体综合征(小儿痴呆)[10]。胎儿会有一定比例的DNA透过胎盘到达母亲的外周血中,孕妇外周血中5%的低频胎儿DNA的非整倍体特性可以通过深度测序达到99%的灵敏度和99%的特异度。肿瘤细胞DNA也会释放到血浆中成为游离肿瘤DNA(ctDNA),使用深度测序同样可以检测到体内是否存在拷贝数变化的染色体片段。目前针对ctDNA研究主要集中在如何检测到低频的SNV和CNV从而指导个体化用药及预后措施[11-14],本发明首次提供了证据证明利用CNV这一特异性极高的标志物可以同时筛查多种早期肿瘤。参考文献:1.Ahlquist,D.A.,Moleculardetectionofcolorectalneoplasia.Gastroenterology,2010.138(6):p.2127-39.2.deVos,T.,etal.,CirculatingmethylatedSEPT9DNAinplasmaisabiomarkerforcolorectalcancer.ClinChem,2009.55(7):p.1337-46.3.Ahlquist,D.A.,etal.,Next-generationstoolDNAtestaccuratelydetectscolorectalcancerandlargeadenomas.Gastroenterology,2012.142(2):p.248-56;quize25-6.4.Lofton-Day,C.,etal.,DNAmethylationbiomarkersforblood-basedcolorectalcancerscreening.ClinChem,2008.54(2):p.414-23.5.Grutzmann,R.,etal.,Sensitivedetectionofcolorectalcancerinperipheralbloodbyseptin9DNAmethylationassay.PLoSOne,2008.3(11):p.e3759.6.Tanzer,M.,etal.,PerformanceofepigeneticmarkersSEPT9andALX4inplasmafordetectionofcolorectalprecancerouslesions.PLoSOne,2010.5(2):p.e9061.7.Zou,H.,etal.,Quantificationofmethylatedmarkerswithamultiplexmethylation-specifictechnology.ClinChem,2012.58(2):p.375-83.8.Imperiale,T.F.,etal.,MultitargetstoolDNAtestingforcolorectal-cancerscreening.NEnglJMed,2014.370(14):p.1287-97.9.Beroukhim,R.,etal.,Thelandscapeofsomaticcopy-numberalterationacrosshumancancers.Nature,2010.463(7283):p.899-905.10.Chiu,R.W.,etal.,Non-invasiveprenatalassessmentoftrisomy21bymultiplexedmaternalplasmaDNAsequencing:largescalevaliditystudy.BMJ,2011.342:p.c7401.11.Heitzer,E.,etal.,Tumor-associatedcopynumberchangesinthecirculationofpatientswithprostatecanceridentifiedthroughwhole-genomesequencing.GenomeMed,2013.5(4):p.30.12.Heitzer,E.,etal.,Establishmentoftumor-specificcopynumberalterationsfromplasmaDNAofpatientswithcancer.IntJCancer,2013.133(2):p.346-56.13.Chan,K.C.,etal.,Cancergenomescanninginplasma:detectionoftumor-associatedcopynumberaberrations,single-nucleotidevariants,andtumoralheterogeneitybymassivelyparallelsequencing.ClinChem,2013.59(1):p.211-24.14.Jiang,P.,etal.,LengtheningandshorteningofplasmaDNAinhepatocellularcarcinomapatients.ProcNatlAcadSciUSA,2015.技术实现要素:本发明的实施方式举例除非特别说明,本发明所用术语的含义均按照相关领域公知的广义含义来理解。实施例1.使用染色体臂水平的染色体变异指数区分健康人和早期肿瘤患者为了证明染色体变异指数可以作为新型肿瘤标记物用来筛查早期肿瘤,本实验收集29例胃肠镜检测未发现异常的正常人血浆样本;17例样本早中期结直肠癌患者血浆样本,其中I期结直肠癌7例,II期结直肠癌10例;3例早期乳腺癌血浆样本,2例早期肺癌样本和2例早期宫颈癌样本。所有肿瘤分期都以临床病理判断为准。实验检测流程如下:(1)使用血浆游离DNA提取试剂盒从1ml血浆中提取游离DNA,Qubit检测浓度;(2)在步骤(1)中提取的DNA片段两端加上测序仪兼容的接头实现测序前的样本建库准备;(3)构建好的文库使用测序仪进行测序,此处优选的illuminaHiSeqXTen测序仪,测序策略为PE150,数据量10G;(4)下机测序数据质控。数据分析流程如下:(1)所有样本的原始测序数据过滤去除低质量reads得到cleanreads;(2)所有cleanreads都和人类参考基因组比对形成BAM文件,统计落在不同染色体区域的reads数量和游离DNA片段大小,并进一步均一化为各区域的reads数占全部染色体选定区域总reads数的比例;其中所有样本的统计reads均为GC矫正后的reads;(3)计算染色体变异指数。基于Zscore的染色体变异指数我们选择四种计算方式,分别为SZabs、SZsq、SZsqm和SSZsq,分别定义为:SZabs:以正常人的数据为参考数据库计算各染色体区域reads比例在所有正常人群中的平均值μ和标准差δ,然后计算指定样本染色体区域i的Zscore:。SZabs为该样本所有染色体区域Zscore的绝对值之和:;SZsq:以正常人的数据为参考数据库计算各染色体区域reads比例在所有正常人群中的平均值μ和标准差δ,然后计算指定样本各染色体区域i的Zscore:。SZsq为该样本中所有染色体区域Zscore的平方和;;SZsqm:以正常人的数据为参考数据库计算各染色体区域reads比例在所有正常人群中的平均值μ和标准差δ,然后计算指定样本各染色体区域i的Zscore:。SZsq-m即为该样本中除去绝对值最大Zscore的染色体区域后的所有区域Zscore的平方和;SSZsq:本指数的原理是如果某个染色体区域i发生变异,则其它所有染色体稳定区域与该区域的丰度比例Ri均会发生变化,那么统计其它所有区域的Ri相对于正常样本Ri的变异程度则可反映区域i的变异程度。具体计算步骤为:(1)以区域i为参考计算所有样本的其余区域k的比值;(2)计算在正常人群参考数据库中Rki的平均值μki和标准差δki,然后计算指定样本各染色体区域k的Zscore:;(3)计算染色体区域i的变异程度;(4)SSZsq定义为所有染色体区域的变异程度Vi之和:基于此四种染色体变异指数的计算形式计算得到的结直肠癌筛查敏感度和特异度表1所示。从表1中可见,染色体变异指数都能比较灵敏和特异的从血浆中区分肿瘤患者和正常人,尤其是SSZsq表现最好。染色体变异指数SZabSZsqSZsqmSSZsq敏感度88.24%94.12%94.12%94.12%特异度93.10%93.10%93.10%96.55%表1.不同染色体变异指数在结直肠癌筛查中的敏感度和特异度对比。染色体拷贝数变异是包括结直肠癌在内的所有肿瘤的最普遍的特征,为了验证血浆染色体变异指数能否作为跨癌种肿瘤标记物,我们纳入3例乳腺癌、2例肺癌和2例宫颈癌样本的数据结果并以SSZsq为指标计算跨癌种的敏感度和特异度,如表2所示。从表2中可以看出染色体变异指数作为跨癌种的肿瘤标志物也能达到较好的性能指标。癌种跨癌种结直肠癌肺癌乳腺癌宫颈癌敏感度91.67%94.12%100.00%66.67%100.00%特异度86.21%86.21%86.21%86.21%86.21%表2染色体变异指数SSZsq在多癌种筛查中的性能指标。基于游离DNA片段大小为权重的染色体变异指数分析。研究发现在血浆游离DNA中来源于肿瘤的游离DNA片段偏小,而片段较大的游离DNA中来源于正常组织的比例较大。依据此原理我们游离DNA片段大小这个独立因素引入染色体变异指数。游离DNA片段大小可以根据测序时双端PE测序reads在基因组上比对计算得到,并在统计不同染色体区域读取数丰度时根据reads片段大小给予该reads不同的权重。在本发明的具体实施例中,我们考虑155bp以下游离DNA片段中循环肿瘤DNA所占比例较高,给予长度在155bp以下DNA片段的权重为x1(0≤x1≤1),155bp以上的DNA片段的权重为x2(0≤x2≤1),x1+x2=1。区别于正常分析流程,当所测的DNA片段小于155bp时,计算GC矫正后的reads数量需乘以权重x1;当所测的DNA片段大于155bp时,计算GC矫正后的reads数量需乘以权重x2;由此可得到各染色体区域经过GC矫正和片段大小加权后的相对reads丰度,并以此为基础计算染色体变异指数。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1