用于预测结直肠癌疗效和预后的基因甲基化面板的制作方法

文档序号:16247459发布日期:2018-12-11 23:42阅读:375来源:国知局
用于预测结直肠癌疗效和预后的基因甲基化面板的制作方法

本发明涉及基因表观遗传学技术领域,尤其涉及一种用于预测肠癌疗效和预后的基因甲基化面板,以及利用该基因甲基化面板诊断肠癌、预测疗效和复发情况,以及预测肠癌预后和死亡风险的方法。

背景技术

结直肠癌是一种常见的恶性肿瘤,起初症状不显著,但随着肿瘤的增大会逐渐表现出排便习惯改变、便血、腹泻、腹泻与便秘交替、局部腹痛等症状,晚期则表现贫血、体重减轻等全身症状。肠癌的发病率和病死率在消化系统恶性肿瘤中仅次于胃癌、食管癌和原发性肝癌,严重影响人类健康和生命。但由于其早期症状不明显,故很难早期发现、及时治疗,由此可见,如果能通过技术革新在肠癌初期阶段即发现病症、对症治疗,将对肠癌的有效治疗具有重要意义。

正常人的血循环中存在由凋亡和坏死的细胞释放的游离dna(cfdna),而肿瘤患者的血循环中还可检测到游离循环肿瘤dna(ctdna)。ctdna相当于肿瘤细胞释放到血液中的身份指纹,由于其携带有与原发肿瘤相一致的甲基化改变,理论上可以利用ctdna的甲基化谱对肿瘤进行诊断,这一被称为“液体活检”(liquidbiopsy)的新技术已经成为当前肿瘤研究领域的热点之一。但是,ctdna在血液中的含量极微,每毫升血中仅有约20ng,相当于一滴水的一亿分之一,并且混杂在更大量的正常游离dna背景中。

随着甲基化特异性pcr、二代测序(ngs)等技术的快速发展,准确、高通量和相对廉价的dna甲基化谱检测应运而生。因此,ctdna甲基化谱检测可以有助于癌症的早期诊断、早期评估、早期预防和早期治疗。



技术实现要素:

本发明要解决的技术问题是提供一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板,以及利用这种基因甲基化面板诊断结直肠癌、预测疗效和复发情况,以及预测结直肠癌预后和死亡风险的方法。

第一个方面,本发明提供一种用于预测结直肠癌疗效和预后的基因甲基化面板,所述基因甲基化面板包括第一组甲基化基因和第二组甲基化基因,所述第一组甲基化基因包括myo1g、adamts4、bmpr1a、cd6、rbp5、chr13:10、lgap5、atxn1和chr8:20,所述第二组甲基化基因包括myo1g和gcet2。

进一步地,所述基因甲基化面板测定结直肠癌患者血浆中的myo1g、adamts4、bmpr1a、cd6、rbp5、chr13:10、lgap5、atxn1和chr8:20的基因甲基化水平的改变,以预测结直肠癌的治疗疗效。

进一步地,所述基因甲基化面板测定结直肠癌患者血浆中的myo1g和gcet2的基因甲基化水平的改变,以预测结直肠癌患者的预后和死亡风险。

第二个方面,本发明提供一种上述用于预测结直肠癌复发和预后的基因甲基化面板的检测方法,包括以下步骤:

第一步,在血浆中提取ctdna;

第二步,将提取的所述ctdna进行亚硫酸盐转化,使所述ctdna中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变,得到亚硫酸盐转化ctdna;

第三步,用深度测序的方法测定所述亚硫酸盐转化ctdna的甲基化水平的改变;

第四步,探针的设计和合成;

第五步,通过所述探针对所述亚硫酸盐转化ctdna进行捕获扩增并进行测序;

第六步,数据的分析和模型的建立。

在本发明的检测方法的第一步中,血浆可以是正常人的血浆或者结直肠癌患者的血浆。ctdna(circulatingtumordna)是指循环肿瘤dna。在本发明中,深度测序也称高通量测序技术,为本领域技术人员所知晓的一种测序技术。

在上述检测方法中,第四步所述探针的设计和合成具体包括以下步骤:

首先,对tcga和gse数据库里的肠癌组织样本和正常人血浆样本的450k基因甲基化芯片数据进行分析,找出甲基化水平明显差异的基因;

针对筛选出来的基因设计探针并合成。

在本发明中,采用常规探针设计软件设计探针,如采用ppdesigner软件设计上述方法筛选出来的甲基化水平差异明显的基因探针。探针的合成方法则采用现有成熟技术,如采用核酸杂交技术,用单独的寡核苷酸进行探针合成。

在本发明中,可以通过本领域常用方法使用探针捕获亚硫酸盐转化ctdna,经扩增后进行相应测序。或者,优选地,采用以下步骤进行捕获扩增后并测序:

首先,将所述亚硫酸盐转化ctdna与第四步中合成的所述探针混合于反应缓冲液,在所述反应液中加矿物油;

然后,对所述反应液进行退火、变性、扩增并给每个血浆样本附上条码,pcr反应建立文库,并保留有效的捕获,去除空白的捕获;

最后,根据illumina公司所提供的pcr方法纯化所建文库,采用illumina公司的miseq和hiseq2500系统测序,得到测序结果。

其中,所述反应缓冲液采用本领域常用于dna捕获的反应缓冲液。

优先地,所述亚硫酸盐转化ctdna与所述探针按照1:20000的摩尔比混合。所述矿物油是为了防止反应液蒸发。

进一步地,第五步中对所述亚硫酸盐转化ctdna进行捕获扩增,是因为测序的原始捕获实验结果(即测序结果)在高效率的探针和低效率的探针中读取的结果有显著差异,为了优化,故需要进行捕获,使测序的覆盖更加均匀、测序结果更加合理。

进一步地,第六步中,所述数据的分析和模型的建立采取以下步骤:

首先,通过将结直肠癌血浆样本和正常对照的血浆样本随机按2:1的比例分为训练集和验证集,用lasso和随机森林的方法进行基因筛选,两种方法重叠的基因有9个,分别为myo1g,adamts4,bmpr1a,cd6,rbp5,chr13:10,lgap5,atxn1,chr8:20;

然后,通过逻辑回归方法,采用这9个甲基化基因作为协变量建立诊断预测模型,计算联合诊断指数,并在所述验证集中进行验证;

同样,将肠癌血浆样本分为训练集和验证集,先通过对每一个基因作为协变量建立一个单变量cox比例风险模型,筛选出与患者预后相关的基因进行下一步分析;

接着,采用lasso-cox多因素回归分析,最终筛选出甲基化基因进行预后的分析,分别为myo1g,gcet2;

最后,通过拟合多变量cox比例风险模型,在训练集确定这2个甲基化基因中每一个基因的系数,计算合并后的预后评分指数,并在验证集中进行验证。

在本发明中,联合诊断指数(combineddiagnosisscore)定义为cd-score。预后评分指数(combinedprognosticscore)定义为cp-score。

优先地,所述lasso方法采用二次抽样方法不重复抽样75%的数据集500次,选择出现频率超过450次的甲基化基因共13个;所述随机森林方法采用oob误差最小化准则,通过设置变量每次重复的分数下降0.3的原则进行随机变量的消除,最后筛选出22个甲基化基因。其中oob是指out-of-bag,泛指误差估计的方法。

第三个方面,本发明提供一种用于预测肠癌复发的方法,包括以下步骤:

提供如上所述的基因甲基化面板,以所述第一组甲基化基因构建诊断预测模型,所述第一组甲基化基因包括myo1g、adamts4、bmpr1a、cd6、rbp5、chr13:10、lgap5、atxn1和chr8:20;

提供结直肠癌血浆样本,根据所述诊断预测模型计算出肠癌血浆样本的联合诊断指数,以预测结直肠癌的复发情况。

第四个方面,本发明提供一种用于预测结直肠癌预后的方法,包括以下步骤:

提供如上所述的基因甲基化面板,以所述第二组甲基化基因构建预后风险模型,所述第二组甲基化基因包括myo1g和gcet2;

提供结直肠癌血浆样本,根据所述预后风险模型计算出结直肠癌血浆样本的预后评分指数,以预测结直肠癌的预后情况。

与现有技术相比,本发明具有以下有益效果:

本发明提供的是一种可用于诊断、预测结直肠癌疗效和预后的基因甲基化面板,同时提供了利用该基因甲基化面板诊断、预测结直肠癌复发和预后的方法,可用于早期诊断结直肠癌,并预测结直肠癌患者的治疗效果、复发和预后,该基因甲基化面板共包含10个基因,通过检测患者血浆中yo1g、adamts4、bmpr1a、cd6、rbp5、chr13:10、lgap5、atxn1和chr8:20共9个基因甲基化水平的改变,可以用于诊断结直肠癌和预测结直肠癌的疗效,这意味着早期结直肠癌患者可及时确诊并治疗。通过检测患者血浆中myo1g和gcet2共2个基因甲基化水平的改变,可以用于预测结直肠癌患者的预后和死亡风险,这有利于指导医生对不同患者进行个体化的精准治疗。本发明提供的是一种可用于诊断、预测结直肠癌疗效和预后的基因甲基化面板提高了通过结直肠癌患者血液诊断和预后预测的准确性。

附图说明

图1至图3是本发明用于诊断、预测结直肠癌疗效复发和预后的基因甲基化面板在应用中的数据分析图。

具体实施方式

以下结合说明书附图和具体实施例来进一步说明本发明,但实施例并不对本发明做任何形式的限定。除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。除非特别说明,以下实施例所用试剂和材料均为市购。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,本发明实施例的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本实施例公开了一种用于诊断、预测结直肠癌疗效和预后的基因甲基化面板,该基因甲基化面板包括第一组甲基化基因和第二组甲基化基因,第一组甲基化基因包括myo1g、adamts4、bmpr1a、cd6、rbp5、chr13:10、lgap5、atxn1和chr8:20,第二组甲基化基因包括myo1g和gcet2。该基因甲基化面板测定结直肠癌患者血浆中myo1g、adamts4、bmpr1a、cd6、rbp5、chr13:10、lgap5、atxn1和chr8:20的基因甲基化水平改变,用于诊断肠癌和预测结直肠癌的疗效和复发。该基因甲基化面板测定结直肠癌患者血浆中myo1g和gcet2的基因甲基化水平改变,用于预测结直肠癌患者的预后和死亡风险。

本实施例还公开了上述用于预测结直肠癌复发和预后的基因甲基化面板的检测方法,包括以下步骤:

第一步,在血浆中提取ctdna;

第二步,将提取的ctdna进行亚硫酸盐转化,使其ctdna中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变,得到亚硫酸盐转化ctdna;

第三步,用深度测序的方法测定所述亚硫硫酸盐转化ctdna的甲基化水平的改变;

第四步,探针的设计和合成;具体是:首先,对tcga和gse数据库里的肠癌组织样本和正常人血浆样本的450k基因甲基化芯片数据进行分析,找到甲基化水平明显差异的基因;然后,用ppdesigner软件设计上述方法筛选出来的甲基化水平差异明显的基因探针,并进行合成,如采用核酸杂交技术,用单独的寡核苷酸进行探针合成。

第五步,通过所述探针对所述亚硫酸盐转化ctdna进行捕获扩增并进行测序;具体是:将10ng亚硫酸盐转化ctdna与第四步中合成的所述探针按照1:20000的摩尔比混合于20μl反应缓冲液中形成反应液,并在反应液中加矿物油防止反应液蒸发;对反应液进行退火、变性、扩增并给每个血浆样本附上条码,pcr反应建立文库,并保留有效的捕获,去除空白的捕获;根据illumina公司所提供的pcr方法纯化所建文库,采用illumina公司的miseq和hiseq2500系统测序,得到测序结果。

由于测序的原始捕获实验结果(即测序结果)在高效率的探针和低效率的探针中读取的结果有显著差异,为了优化,故对原始的测序结果进行相对效率计算,混合探针时根据调节后的摩尔比率进行混合。

第六步,数据的分析和模型的建立。具体是:首先,通过将肠癌血浆样本和正常对照的血浆样本随机按2:1的比例分为训练集和验证集,选用lasso和随机森林的方法进行基因筛选;

其中,lasso方法采用二次抽样方法不重复抽样75%的数据集500次,选择出现频率超过450次的甲基化基因共13个。随机森林方法采用oob误差最小化准则,通过设置变量每次重复的分数下降0.3的原则进行随机变量的消除,最后筛选出22个甲基化基因。

上述两种方法重叠的甲基化基因有9个(如表1所示),分别是myo1g、adamts4、bmpr1a、cd6、rbp5、chr13:10、lgap5、atxn1和chr8:20。

然后,通过逻辑回归方法,采用这9个重叠的甲基化基因作为协变量建立诊断预测模型,计算联合诊断指数(cd-score),并在所述验证集中进行验证;

同样,将结直肠癌血浆样本分为训练集和验证集,先通过对每一个基因作为协变量建立一个单变量cox比例风险模型,筛选出与患者预后相关的基因进行下一步分析;

接着,采用lasso-cox多因素回归分析,最终筛选出2个甲基化基因进行预后的分析(如表2所示),分别为myo1g和gcet2;

最后,通过拟合多变量cox比例风险模型,在训练集确定这2个甲基化基因中每一个基因的系数,计算合并后的预后评分指数(cp-score),并在验证集中进行验证(如表3所示)。

表1:9个用于诊断早期结直肠癌的基因

表2:2个用于预测结直肠癌预后的基因

表3:结直肠癌患者多变量生存分析

应用例1

通过逻辑回归方法,用基因甲基化面板(包括9个甲基化基因:myo1g、adamts4、bmpr1a、cd6、rbp5、chr13:10、lgap5、atxn1、chr8:20)构建了一个诊断预测模型。应用该模型诊断结直肠癌,在训练集中的敏感性87.5,特异性89.9,验证集中的敏感性为87.9,特异性89.6。这个模型可以非常好的区分结直肠癌与正常对照组在训练数据集(auc=0.9571)和验证数据集(auc=0.9569)(如图1所示)。证实这9个基因甲基化面板可以用于区分结直肠癌患者与正常人。

应用例2

采用上述建立的诊断预测模型,计算出每个样本的联合诊断指数(cd-score),采用这个联合诊断指数,可以很好地预测结直肠癌患者的治疗疗效和复发(如图2所示)。有肿瘤负荷的患者的cd-scores值明显高于正常对照组(p<0.0001,如图2a所示)。同样,手术后病人的cd-scores值较手术前明显降低,患者术后出现肿瘤复发,cd-scores值则会再度升高(p<0.001,如图2b所示)。此外,cd-scores值与肿瘤分期有关。早期患者(i,ii期)的cd-scores值明显低于晚期(iii,iv期)患者(p<0.0001,如图2c所示)。说明根据这9个基因甲基化水平建立的模型可用于结直肠癌的早期诊断、治疗疗效的判断、预测肿瘤的复发。

应用例3

通过拟合多变量cox比例风险模型,用基因甲基化面板(包括2个甲基化基因:myo1g和gcet2)构建了一个预后风险模型,并计算出每个样本的预后评分指数(cp-score)。选取cp-score的中位值为cut-off值,将结直肠癌患者分为低风险组和高风险值。无论在训练集还是验证集,低风险组患者的生存均明显优于高风险组(如图3所示)。多元变量分析表明,cp-score与死亡风险显著相关,并且cp-score是一个独立的预后危险因素(如表3所示)。联合cp-score和分期、肿瘤部位、癌胚抗原等临床指标,可进一步的改进对结直肠癌患者预后的预测能力。

基于上述技术方案,本发明所述的基因甲基化面板及检测方法,可有效的用于诊断、预测结直肠癌疗效和预后。该甲基化面板包括两组甲基化基因,对于第一组甲基化基因而言,通过检测患者血浆中myo1g、adamts4、bmpr1a、cd6、rbp5、chr13:10、lgap5、atxn1和chr8:20共9个基因甲基化水平的改变,可用于诊断结直肠癌和预测结直肠癌的治疗疗效;对于第二组甲基化基因而言,通过检测患者血浆中myo1g和gcet2共2个基因甲基化水平的改变,可用于预测结直肠癌的预后和死亡风险,并通过检测方法来实现。本发明提高了通过结直肠癌患者血液诊断和预后预测的准确性。

以上对本发明实施例公开的一种用于预测结直肠癌疗效和预后的基因甲基化面板及检测方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1