筛选甲基化PCR检测的目标区域的方法、试剂盒及应用与流程

文档序号:15199530发布日期:2018-08-19 10:06阅读:4388来源:国知局

本申请涉及核酸甲基化pcr检测领域,特别是涉及一种筛选甲基化pcr检测的目标区域的方法、试剂盒及应用。



背景技术:

dna的异常甲基化和基因突变是肿瘤发生与发展的重要原因,前者可能在肿瘤的超早期就已发生,是促进肿瘤生长的“种子”因素。在哺乳动物中,dna甲基化主要发生在cpg二核苷酸相连的c碱基上。cpg以两种形式存在,一种分散于dna高度或中度重复序列中,如alu;另一种cpg高度聚集,形成cpg岛(缩写cgi),位于基因的5’端启动子区域,也可延伸至基因的外显子区。研究表明,基因组启动子区的甲基化,是导致癌症发生的重要分子改变之一,随着癌症的进展,甲基化也呈现动态改变的趋势;此外,不同种类的癌症的甲基化图谱也存在明显的差异;用这一特点,可以展开基于甲基化检测的肿瘤早期筛查应用。cpg岛中的cpg通常处于非甲基化状态,其异常甲基化与癌症密切相关,是研究和检测基因甲基化状态的关键区域。甲基化一般都是连续发生的,即某一cpg位点发生甲基化,那么该位点上下游一定区域内的cpg也相应的发生甲基化。

甲基化的检测主要关注基因启动子区的cpg岛相关区域,包括cpg岛(约1kb的区域)及其两侧的shore(即岛两侧约2kb)和shelf(岛两侧2~4kb的区域),总共约9kb的区域,检测手段有甲基化pcr和甲基化测序技术。

甲基化pcr快速简便,是检测热点区域甲基化状态的有效手段。甲基化pcr是将模板dna进行亚硫酸氢盐转化后,将dna序列中的非甲基化的胞嘧啶(c)转化为尿嘧啶(u),而甲基化胞嘧啶(5mc)保持不变,根据转化后的dna序列中胞嘧啶位点的c-u转化差异设计相应的甲基化和非甲基化引物进行pcr扩增,结合凝胶电泳或qpcr荧光曲线等检测手段,记录转化后模板dna是否得以扩增,来判断原始模板dna是否甲基化。若经亚硫酸氢盐转化后的模板dna用甲基化引物能够扩增而非甲基化引物不能扩增,说明原始模板在此处为全甲基化;反之说明原始模板为全非甲基化;若转化后的模板dna用甲基化和非甲基化引物均能够扩增,说明原始模板在此处为部分甲基化。甲基化pcr主要有两种设计思路:一、设计甲基化引物对转化后模板dna进行扩增,结合凝胶电泳条带分析;二、在待测区域两边设计普通pcr引物,而在待测区域内设计荧光探针,用荧光pcr扩增曲线记录转化后模板dna的扩增情况,根据ct值分析原始模板的甲基化状态。

甲基化测序技术可测全基因组范围内cpg的甲基化状态,如wgbs全基因组重亚硫酸盐测序,rrbs简化表观亚硫酸氢盐测序,medip甲基化dna免疫共沉淀测序等,也可用引物或探针捕获特定区域后,通过不同的测序技术,例如sanger或焦磷酸测序,检测目的区域内的cpg位点甲基化状态。测序技术可检测范围广,通量较高,信息较全面;但测序耗时较长,需要测序设备及数据解读平台和时间,费用相对较高,不利于临床推广。

甲基化检测覆盖范围可分为大、中、小三个维度,大范围的检测主要是全基因组甲基化测序技术,检测位点广泛但费用相对较高;中等覆盖度的检测可用芯片捕获测序技术,可实现对热点的针对性检测,节约成本;小范围的检测用甲基化特异性pcr技术,可实现对数个热点甲基化状态的快速、灵敏检测,不需测序,费用相对低。目前应用最多的是后两种检测方法,这两种方法都需要从基因组范围内筛选热点区域,从而设计探针或引物,有针对性的检测目标区域的甲基化状态。热点区域的筛选,即biomarker筛选,又或者称为目标区域或目标位点的筛选,对于甲基化pcr检测和探针捕获测序都尤其重要。

甲基化biomarker筛选是有目的地实现甲基化pcr技术的前提及重要基础,目前主要存在以下几种方法:

方法一:在目标基因的整个启动子区域进行引物或探针设计。目标基因的确定主要来源于文献总结,基因的可靠性没有得到中国人群或大样本量的验证,没有明确的cpg位点或区域,只要启动子某个区域可以设计相应的探针或引物,即可用于biomarker备选。该方法的特点是,通过文献确定基因及启动子。该方法的缺点是盲筛、没有明确的cpg位点或区域、缺少大样本数据验证、在组织或血浆等待检测样本的敏感性和特异性不可预期。

方法二:imrannawazetal.使用公开数据库,如tcga甲基化芯片数据,结合表达谱数据,寻找在癌症组与正常组甲基化程度有差异、并且与基因表达呈负调控的关系,结合少量样本的实测性能表现及文献总结的结果,进行biomarker筛选。该方法的优势是使用公开的大样本的数据进行支持使用一些过滤条件、并且结合了表达谱调控关系、可精确到位点,缺点是只用少量实测样本过滤大量biomarker容易导致重要的潜在biomarker漏检、需阅读大量文献。

方法三:xiaokehaoetal.使用公开的数据库比如tcga甲基化芯片数据,通过机器学习的算法,构建模型,寻找在公开数据库里最佳敏感性特异性的特征集,这些特征集即为biomarker。该方法的优势是使用公开的大样本的数据进行机器学习的算法及模型构建,可精确到位点,在已有样本中敏感性特异性较理想;缺点是甲基化450k芯片约48万个位点,容易出现过拟合或欠拟合的现象,也容易导致算法及模型构建的运算量超级大,容易过负荷;并且容易出现假阳性biomarker。

因此,研发新目标区域的筛选方法,对于甲基化pcr的检测和基于甲基化检测的肿瘤早期筛查具有重要意义。



技术实现要素:

本申请的目的是提供一种新的筛选甲基化pcr检测的目标区域的方法,甲基化pcr检测的试剂盒,及该试剂盒的应用。

本申请采用了以下技术方案:

本申请的一方面公开了一种筛选甲基化pcr检测的目标区域的方法,包括以下步骤;

(1)从甲基化芯片数据库中获取待分析肿瘤的甲基化芯片及对应的转录组测序数据;

(2)统计正常组与癌症组的甲基化程度值,筛选在不同组别中具有显著差异的甲基化位点;

(3)联合转录组测序表达谱的分析,统计相关系数,筛选负相关位点,获得甲基化候选位点列表;

(4)将步骤(3)获取的甲基化候选位点列表,与现有披露的所有相关的文献进行关联,筛选获得文献支持报道多且组间甲基化差异程度大、与表达量负相关的位点;与此同时,对步骤(3)获取的甲基化候选位点列表使用回归方法,对已有公开的肿瘤组织样本进行训练集和测试,获取最佳敏感性、特异性的位点集合;即获得本申请的甲基化pcr检测的目标区域。

需要说明的是,本申请的方法综合分析甲基化芯片数据库、转录组测序表达谱和文献研究结果,在这些数据基础上,经过多重数据过滤分析,并结合回归算法,补充文献以外的其它基因,弥补了目前常见biomaker筛选方法的缺陷,整合了所有可以利用的数据和机器学习的算法进行全面、可靠的预测。本申请的一种实现方式中,采用本申请的目标区域筛选方法,从tcga数据库27k+450k位点范围内筛选到几十个与结直肠癌和肺癌高度相关的异常甲基化基因,缩小了检测范围,使检测内容更有针对性,能够在pcr、焦磷酸测序等小通量的技术平台上实现对标志物的检测;节约了检测费用和时间。

优选的,步骤(1)中,甲基化芯片数据库为tcga甲基化芯片数据库,甲基化芯片为甲基化450k芯片。

优选的,步骤(3)中,相关系数包括与位点甲基化程度beta值相关的系数,即spearman、pearson、kendall三个系数,通过这三个系数筛选负相关的位点,其中,相关系数绝对值越接近1,表示越相关。

优选的,步骤(4)中,回归算法为lasso回归算法。其中,lasso即leastabsoluteshrinkageandselectionoperator的缩写。

优选的,步骤(2)中,筛选在不同组别中具有显著差异的甲基化位点,具体包括,通过tcga样本命名规则,对样本进行归类,要求正常组与癌症组间的甲基化信号值差异即两个组间候选位点的t检验满足p值小于0.01,delta-beta值至少为0.2,同时要求任何一个组,平均甲基化程度信号值,即beta值最多为0.1。

需要说明的是,以上步骤(2)的优选方案,目的是为了筛选其中一组为低甲基化或没有发生甲基化的状态,另一组为高甲基化的状态,此时筛选得到的biomarker最有意义;其中,低甲基化或没有发生甲基化的组通常是正常组,高甲基化的组通常是癌症组。

本申请的另一面公开了采用本申请的方法获得的与结直肠癌相关的甲基化异常的目标区域,这些目标区域包括septin9、bmp3、rassf2、pcdh10、sdc2、igfbp3、ndrg4、tfpi2、gata5、sfrp2、chfr和alx4基因。

本申请的另一面公开了本申请与结直肠癌相关的甲基化异常的目标区域在制备结直肠癌检测试剂中的应用。

需要说明的是,septin9、bmp3、rassf2、pcdh10、sdc2、igfbp3、ndrg4、tfpi2、gata5、sfrp2、chfr和alx4基因都是已知的基因,但是,本申请率先采用本申请的方法从数据库众多的基因中筛选出这些与结直肠癌直接相关的基因,通过对这些基因的甲基化进行检测,即可实现对结直肠癌的早期诊断或筛查。可以理解,针对这些基因可以制备结直肠癌检测试剂,例如特异性的甲基化检测引物、探针等。

本申请的另一面公开了采用本申请的方法获得的与肺癌相关的甲基化异常的目标区域,这些目标区域包括ptger4、pbx1、duox1、sct、csdap1、meis2、shox2、pax6、drd5和tbx5基因。

本申请的另一面公开了本申请与肺癌相关的目标区域在肺癌检测中的应用。

可以理解,ptger4、pbx1、duox1、sct、csdap1、meis2、shox2、pax6、drd5和tbx5基因也是已知的基因,本申请创造性的从众多基因中筛选出这些基因,通过对这些基因的甲基化检测可以实现肺癌的早期诊断或筛查,为肺癌的检测提供了更准确可靠的检测靶标位点。

本申请的再一面公开了一种甲基化pcr检测结直肠癌的试剂盒,该试剂盒中包括第一组引物至第八组引物中的至少一组,每组引物都由甲基化特异引物对和非甲基化特异引物对组成;第一组引物中,甲基化特异引物对上下游引物分别为seqidno.1和2所示序列,非甲基化特异引物对上下游引物分别为seqidno.3和4所示序列;第二组引物中,甲基化特异引物对上下游引物分别为seqidno.5和6所示序列,非甲基化特异引物对上下游引物分别为seqidno.7和8所示序列;第三组引物中,甲基化特异引物对上下游引物分别为seqidno.9和10所示序列,非甲基化特异引物对上下游引物分别为seqidno.11和12所示序列;第四组引物中,甲基化特异引物对上下游引物分别为seqidno.13和14所示序列,非甲基化特异引物对的上下游引物为seqidno.15和16所示序列;第五组引物中,甲基化特异引物对上下游引物分别为seqidno.17和18所示序列,非甲基化特异引物对的上下游引物为seqidno.19和20所示序列;第六组引物中,甲基化特异引物对上下游引物分别为seqidno.21和22所示序列,非甲基化特异引物对的上下游引物为seqidno.23和24所示序列;第七组引物中,甲基化特异引物对上下游引物分别为seqidno.25和26所示序列,非甲基化特异引物对的上下游引物为seqidno.27和28所示序列;第八组引物中,甲基化特异引物对上下游引物分别为seqidno.29和30所示序列,非甲基化特异引物对的上下游引物为seqidno.31和32所示序列。

需要说明的是,本申请甲基化pcr检测结直肠癌的试剂盒中,第一组引物至第八组引物依序为检测septin9、alx4、rassf2、sfrp2、sdc2、tfpi2、ndrg4、chfr八个基因甲基化的特异性引物,可以理解,这八个基因是按照本申请的方法获得的与结直肠癌相关的甲基化异常的目标区域中权重较高的八个基因,针对这八个基因的甲基化情况检测,可以实现结直肠癌的早期诊断。

本申请的再一面公开了一种甲基化pcr检测肺癌的试剂盒,该试剂盒中包括第九组引物至第十三组引物中的至少一组,每组引物都由甲基化特异引物对和非甲基化特异引物对组成;第九组引物中,甲基化特异引物对上下游引物分别为seqidno.33和34所示序列,非甲基化特异引物对的上下游引物为seqidno.35和36所示序列;第十组引物中,甲基化特异引物对上下游引物分别为seqidno.37和38所示序列,非甲基化特异引物对的上下游引物为seqidno.39和40所示序列;第十一组引物中,甲基化特异引物对的上下游引物为seqidno.41和42所示序列,非甲基化特异引物对的上下游引物为seqidno.43和44所示序列;第十二组引物中,甲基化特异引物对的上下游引物为seqidno.45和46所示序列,非甲基化特异引物对的上下游引物为seqidno.47和48所示序列;第十三组引物中,甲基化特异引物对的上下游引物为seqidno.49和50所示序列,非甲基化特异引物对的上下游引物为seqidno.51和52所示序列。

需要说明的是,本申请甲基化pcr检测肺癌的试剂盒中,第九组引物至第十三组引物依序为检测ptger4、tbx5、duox1、csdap1、meis2五个基因甲基化的特异性引物,可以理解,这五个基因是按照本申请的方法获得的与肺癌相关的甲基化异常的目标区域中权重较高的五个基因,针对这五个基因的甲基化情况检测,可以实现肺癌的早期诊断。

优选的,以上两个试剂盒中还分别包括参考引物组,参考引物组包括甲基化特异引物对,甲基化特异引物对上下游引物分别为seqidno.53和54所示序列。

其中,参考引物组是检测actb基因的甲基化的引物组,即以actb为参考基因。

在本申请进一步的改进方案中,以上两个试剂盒中,所有甲基化特异引物对的上游引物和/或下游引物的3’末端最后一位碱基为双脱氧核苷酸。

需要说明的是,上游引物和/或下游引物的3’末端最后一位碱基为双脱氧核苷酸,该设计是为了将焦磷酸解激活聚合反应(pyrophosphorolysis-activatedpolymerization,简称pap)与甲基化pcr结合起来,进一步提高甲基化pcr扩增的特异性。

还需要说明的是,2000年liu等在其发表的文献中,liuq&sommerss.,pyrophosphorolysis-activatedpolymerization(pap):applicationtoallele-specificamplification,biotechniques,2000.29(5):1072-6.,将ⅱ型dna聚合酶的焦磷酸解和聚合活性结合在一个反应中,将引物3’端脱氧核苷酸dnmp更换为双脱氧核苷酸ddnmp,使用无3’-5’外切酶活性的dna聚合酶,只有3’末端与模板匹配的引物才能进行扩增,这种扩增依赖焦磷酸解反应的激活,称为焦磷酸解激活聚合反应。与传统的arms-pcr相比,这一改进显著增加了扩增特异性。pap技术被认为是目前等位基因识别特异性最高的技术,主要应用于体细胞突变检测,但是在甲基化检测方面鲜有报道。

本申请的再一面公开了一种核酸甲基化的检测方法,包括采用针对目标区域设计的pap引物,并利用pappcr技术对目标区域进行甲基化检测。

需要说明的是,本申请率先将pappcr技术引入甲基化的检测过程中,提高了甲基化检测的特异性,为基于甲基化检测的肿瘤早期筛选奠定了基础。

优选的,核酸甲基化的检测方法中,目标区域按照本申请的筛选甲基化pcr检测的目标区域的方法获得。

优选的,pap引物的上下游引物中至少一条引物的3’末端最后一位碱基为双脱氧核苷酸。

需要说明的是,由于双脱氧核苷酸的修饰在提高pappcr特异性的同时,会降低扩增效率,因此,本申请的一种实现方式中,只对上游引物和下游引物中的其中一条引物进行3’末端最后一位碱基为双脱氧核苷酸修饰。这样,既能达到提高检测特异性的目的,又能尽量保障扩增效率。

本申请的有益效果在于:

本申请筛选甲基化pcr检测的目标区域的方法,综合分析了甲基化芯片数据库、转录组测序表达谱和文献研究结果,并结合多重数据过滤分析和回归算法,能够更准确、高效、灵敏、特异的获得待分析肿瘤的甲基化pcr检测目标区域,为基于甲基化检测的肿瘤早期筛查奠定了基础。

附图说明

图1是本申请实施例中ndrg4甲基化下游引物末端进行双脱氧碱基修饰前后的飞行时间质谱检测结果;

图2是本申请实施例中actb甲基化上游引物末端进行双脱氧碱基修饰前后的飞行时间质谱检测结果;

图3是本申请实施例中甲基化pappcr检测actb管家基因的扩增产物凝胶电泳图;

图4是本申请实施例中甲基化pappcr检测ndrg4基因的扩增产物凝胶电泳图;

图5是本申请实施例中甲基化pappcr检测阳性参考品ndrg4基因的扩增产物的2100检测结果图;

图6是本申请实施例中甲基化pcr检测sdc2基因的扩增产物凝胶电泳图;

图7是本申请实施例中甲基化pcr检测tfpi2基因的扩增产物凝胶电泳图;

图8是本申请实施例中甲基化pcr检测chfr基因的扩增产物凝胶电泳图;

图9是本申请实施例中甲基化pcr检测sfpr2、alx4、sept9基因的扩增产物凝胶电泳图;

图10是本申请实施例中甲基化pcr检测ndrg4基因的扩增产物凝胶电泳图;

图11是本申请实施例中甲基化pcr检测rassf2基因的扩增产物凝胶电泳图;

图12是本申请实施例中甲基化pcr检测ptger基因的扩增产物凝胶电泳图。

具体实施方式

本申请筛选甲基化pcr检测的目标区域的方法,在数据应用方面,通过文献和公开的tcga甲基化数据库及表达谱数据库分析,结合机器学习算法、文献总结以及少量真实样本的实测验证,能够筛选到取待分析肿瘤异常甲基化相关的基因。

本申请的实施例中,以具有明确甲基化特征的癌症:结直肠癌和肺癌,为对象进行了甲基化pcr检测目标区域的筛选,从tcga数据库27k+450k位点范围内筛选并最终验证了8个与结直肠癌高度相关的异常甲基化基因和5个与肺癌高度相关的异常甲基化基因,大大缩小了检测范围,使检测内容更有针对性。

进一步的,针对所筛选到的与结直肠癌和肺癌高度相关的异常甲基化基因,分别设计了甲基化检测的引物组,从而提出了甲基化pcr检测结直肠癌的试剂盒和甲基化pcr检测肺癌的试剂盒。

在技术方面,本申请的改进方案中,进一步把pap技术用在了甲基化特异性pcr中,即对甲基化特异性引物对中的上游引物和/或下游引物的3’末端最后一个碱基进行双脱氧修饰。本申请成功的将pap与甲基化特异性pcr技术连用,与未引进pap的普通甲基化特异性pcr相比,本申请可提高pcr体系的扩增特异性。与荧光探针pcr相比,本申请只需设计引物而不需要探针,降低了设计和优化的难度,节约了探针合成的成本;对后续多重pcr的可优化和可操作性也优于荧光pcr,理论上可实现大于5重的pcr,同一体系内可检测的biomarker即目标区域更多;且本申请不受pcr仪限制,在没有荧光pcr仪时也可借助凝胶电泳检测pcr产物来使用,利于推广。pap在甲基化检测中的应用,提高了甲基化pcr的扩增特异性,可以扩大应用范围到荧光pcr、多重pcr、组织样本和血浆样本等,也可以应用于不同癌种的筛查。

需要说明的是,本申请筛选甲基化pcr检测的目标区域的方法,不仅限于结直肠癌和肺癌,其它具有甲基化特征的疾病或靶标区域也适用于本申请。检测样本可包括组织、血浆等,检测基因可根据研究目的增减;并且,根据检测基因的不同,可用于不同癌种或其它与表观遗传学相关的疾病筛查、预后检测等。

下面通过具体实施例对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。

实施例

一、甲基化pcr检测目标区域筛选

本例以具有明确甲基化特征的结直肠癌和肺癌为对象进行甲基化pcr检测目标区域的筛选,具体如下:

1.从broad研究所firehose网站(网址:http://gdac.broadinstitute.org/)下载tcga的结直肠癌(colorectaladenocarcinoma)、肺腺癌(lungadenocarcinoma)、肺鳞状细胞癌lungsquamouscellcarcinoma)甲基化450k芯片及对应的转录组测序(rna-seq)的三级数据,该三级数据汇总了癌种满足样本条件,比如有活检的新鲜组织样本,的所有样本经过标准化处理获取每个位点/转录本的信号值的文件,或可以使用firehose_get工具下载,参考脚本如下:

./firehose_get-tasksmethylation_preprocess.level_3stddatalatest-ccoadcoadreadlusc-a

./firehose_get-taskscorrelate_methylation_vs_mrnaanalyseslatest-cluadcoadcoadreadlusc–a

2、统计正常组与癌症组甲基化程度值,筛选在不同组别中具有显著差异的甲基化位点。首选通过tcga样本命名规则,对样本进行归类,要求正常组与癌症组间甲基化信号值差异即两个组间候选位点的t检验满足p值小于0.01,delta-beta值至少为0.2,或者更高,比如0.5;同时要求任何一个组,平均甲基化程度信号值即beta值最多为0.1,此目的是为了筛选其中一组,通常是正常组,为低甲基化或没有发生甲基化的状态,另一组,通常是癌症组,为高甲基化的状态,此时筛选得到的biomarker才有意义。

3、联合转录组测序表达谱的分析,统计相关系数,筛选负相关位点。通常,癌症组某个基因的高甲基化状态会导致该基因表达的失活或表达水平的下降,也即某个基因的甲基化状态会影响基因的表达。分别统计标准化后的表达量与该基因对应位点甲基化程度beta值的相关系数即spearman、pearson、kendall相关系数,筛选到负相关的位点,同时相关系数绝对值越接近1,表示越相关。

4.与文献列表基因进行overlap获取。以上三步获取得到的甲基化候选位点列表,与自主文献调研的基因进行关联,筛选到文献支持报道多且组间甲基化差异程度大、与表达量负相关的位点。

5.通过机器学习算法,抓取特征集。与第4步并行,对前3步骤得到的候选位列表,使用lasso(leastabsoluteshrinkageandselectionoperator)回归等机器学习方法,对已有公开的tcga肿瘤组织样本部分进行训练集,部分进行测试,获取最佳敏感性、特异性的位点集合。

根据以上方法,本例筛选到了12个与结直肠癌高度相关的异常甲基化基因和10个与肺癌高度相关的异常甲基化基因,详细如表1所示。

表1结直肠癌和肺癌的甲基化pcr检测目标区域

二、甲基化pcr检测引物设计

1.常规的甲基化pcr检测引物

本例针对表1筛选到的基因分别设计了甲基化特异性引物和同一区域相应的非甲基化特异性引物。引物设计采用两种不同的思路:

一是针对特定的cg位点设计引物:根据tcga数据库提供的明确的甲基化位点,某一位点的cg,采用oligo等软件,在适当的参数范围内,例如引物长度18-30bp,tm55-62℃,产物长度70-150bp,针对该位点设计符合甲基化pcr需求的引物,特定的c碱基在引物的3’末端最后3个碱基内,一条引物序列中包含2个或以上的cg二核苷酸。

二是基因明确但不针对特定的cg位点设计引物,而是确定该基因的启动子序列后,利用在线甲基化引物设计软件methprimer或abi的甲基化引物设计软件methyl_primer_express_software,设置一定的参数,例如引物长度18-30bp,tm55-62℃,产物长度70-150bp,针对启动子区域设计配对的甲基化和非甲基化特异性引物,作为pcr引物。

methprimer的网址为:http://www.urogene.org/methprimer/

本例在表1所列基因中,优先选择权重较高的基因设计其甲基化特异性引物和非甲基化特异性引物。权重根据数据库筛选时排名,并结合文献报道的基因功能、在临床样本中的性能等特征得出。所设计的引物序列如表2所示,其中,actb为参考基因。

表2甲基化特异引物对和非甲基化特异引物对

表2中,甲基化上游引物即甲基化特异性引物对的上游引物,甲基化下游引物即甲基化特异性引物对的下游引物,非甲基化上游引物即非甲基化特异性引物对的上游引物,非甲基化下游引物即非甲基化特异性引物对的下游引物。

2.pap引物

本例以结直肠癌检测ndrg4的甲基化特异性引物对为例进行pap引物设计,同时,设计了检测参考基因actb的甲基化特异性引物对的pap引物,pap引物如表3所示。其余没有设计为pap引物的,以正常状态使用。

表3pap引物

pap引物与表2中引物的不同之处在于3’末端的碱基为双脱氧碱基。引物合成时只合成不带双脱氧碱基的序列,双脱氧碱基在后续进行寡核苷酸连接反应。由于pap-pcr在提高扩增特异性的同时,可显著降低扩增效率,所以本例所用的pap引物是单边双脱氧引物,即一对引物只有其中一条进行3’末端双脱氧修饰,如表3所示,以平衡扩增特异性和扩增效率。

双脱氧碱基修饰的具体方法如下:

寡核苷酸连接反应,反应体系总计30μl,包括:5×tdt缓冲液(invitrogentm,thermofisherscientific)6μl、100μm的oligo(invitrogentm,thermofisherscientific)5μl、1nmol/μl的ddntp(sigma,sigma-aldrich)12μl、15u/μl的末端脱氧核苷酸转移酶tdt(invitrogentm,thermofisherscientific)6.7μl、分子生物实验级别水(sigma,sigma-aldrich)0.3μl。

反应体系配制好后,在37℃反应4h。然后采用尿素变性聚丙烯酰氨凝胶电泳(page)回收纯化。

尿素变性聚丙烯酰氨凝胶电泳(page)具体如下:

将凝固的尿素变性page胶置于盛有1×tbe的垂直电泳槽中,于250v恒压条件下,预电泳30min备用;寡核苷酸连接反应结束后,从37℃取出,放至室温,每30μl的体系加15μl溴酚黄上样缓冲液,混合均匀,制成点样液;将点样液加入page胶加样孔底部,200v恒压电泳,约1h;电泳结束后,小心将page胶取下转移至1×tbe配置的eb染色液中,染色10min。

切胶回收目的片段,将获取的胶块捣碎,于粉碎的胶块中加入适量的1×nebbuffer2(neb);将悬浮体系置于56℃水浴锅中水浴1h,每隔15min震荡混匀一次;水浴后的混合体系倒入spin-x离心过滤管中,全速离心1min,离心后弃滤膜及碎胶,保留收集管中的流穿液体;用移液器测量流穿液体体积,测量后,向流穿液体中加3倍体积的无水乙醇、20μl的3mnaac(ph5.6)以及2μl糖元(glycogen)(5mg/ml),颠倒混匀,置于-20℃沉淀过夜;将第一天的醇沉体系置于离心机中,4℃全速离心30min;离心后小心倒掉上清,向管底沉淀加700μl的75%乙醇溶液,颠倒混合后置于4℃全速离心10min;再次离心后倒掉上清,向管底沉淀加700μl的75%乙醇溶液,颠倒混合后置于4℃全速离心10min;倒掉上清,将管子开盖置于通风处晾干;向管中沉淀加适量无dnase的水回溶;即获得双脱氧碱基修饰的引物。

本例采用飞行时间质谱检测双脱氧碱基修饰前后的质量值变化,以确定双脱氧碱基修饰是否成功。具体的,分别对ndrg4的甲基化下游引物,即未双脱氧碱基修饰的引物,和ndrg4的甲基化下游引物pap,即双脱氧碱基修饰的引物进行飞行时间质谱检测,结果如图1所示,图1中图a是未双脱氧碱基修饰的引物的检测结果,图b是双脱氧碱基修饰的引物的检测结果,结果显示双脱氧碱基修饰后,引物的分子量增加与预期相符,说明3’端双脱氧碱基修饰成功。同样的,分别对actb的甲基化上游引物,即未双脱氧碱基修饰的引物,和actb的甲基化上游引物pap,即双脱氧碱基修饰的引物进行飞行时间质谱检测,结果如图2所示,图2中图a是未双脱氧碱基修饰的引物的检测结果,图b是双脱氧碱基修饰的引物的检测结果,结果显示双脱氧碱基修饰后,引物的分子量增加与预期相符,说明3’端双脱氧碱基修饰成功。

三、甲基化pcr检测

本例采用健康人血细胞作为阴性参考品,提取健康人外周血细胞dna进行试验,以购买的商品化的人甲基化基因组dna(cpgenomeuniversalmethylateddna,chemicon)为阳性参考品,另外采用一例结直肠癌组织的dna作为结直肠癌的阳性样品,分别采用一例肺腺癌癌组织的dna和一例肺鳞癌癌组织的dna作为肺癌的阳性样品;阴、阳性参考品和三个阳性样品均进行亚硫酸氢盐转化后作为模板dna进行检测。具体如下:

1.dna提取

从样本中提取基因组dna。提取试剂盒为dneasyblood&tissuekit,实验操作步骤如下:

1)缓冲液和试剂的准备

bufferacb和atl:使用前,充分溶解。

bufferaw1和aw2:按照说明书加入无水乙醇。

2)提取前的准备工作

将血细胞样本平衡至室温,所有离心操作都在室温下进行;

打开水浴锅或thermomixer调至56℃。

3)提取步骤

裂解细胞:取200μl血细胞至1.5mlep管,加入40μl蛋白酶k,补充pbs缓冲液至440μl;加入400μlbufferal,旋涡混匀,56℃孵育10min。

提取柱结合:加入无水乙醇400μl,充分混匀,转移至dneasyminispincolumn提取柱内,8000rpm离心1min,将提取柱转移至新的2ml收集管内。

洗涤:加入500μlaw1,8000rpm离心1min,将提取柱转移至新的2ml收集管内;加入500μlaw2,14000rpm离心3min,将提取柱转移至新的1.5mlep管内;

洗脱:加入200μl洗脱液ae,室温放置1min,8000rpm离心1min,收集滤液。可将滤液重新过柱一次以增加dna产量。

4)浓度测定

本例采用qubit测dna浓度,结果显示,提取的dna量符合后续检测的使用需求。

2.亚硫酸氢盐转化与回收

本例亚硫酸氢盐转化所用试剂盒为ezdnamethylation-goldtmkit,试剂盒编号d5005。具体如下:

1)ctconversionreagent的制备:从试剂盒中取出ctconversionreagent(固体混合物),然后添加900μl水,50μl的m-dissolvingbuffer和300μl的m-dilutionbuffer到一管的ctconversionreagent中,在室温下震荡溶解10分钟。

2)m-washbuffer的制备:添加24ml100%的乙醇到m-washbuffer中,制成最终可以使用的m-washbuffer。

3)每次转换的dna最佳量为200-500ng,在待转换的10ng血浆dna样本中加入200nglambdadna,总体积约为20μl并转移到pcr管中。

4)在pcr管中添加130μl的ctconversionreagent,通过轻弹试管或移液器操作来混合样品。

5)将样品管放到pcr仪上按以下步骤操作:98℃放置3分钟,64℃放置2.5小时,立刻进行下一步操作或者在4℃下存储备用,4℃下存储最多20小时。

7)添加600μl的m-bindingbuffer到zymo-spinictmcolumn中,并将柱放入试剂盒所提供的collectiontube中。

8)装填样品到含有m-bindingbuffer的zymo-spinictmcolumn。盖上盖将柱颠倒数次来混合样品。

9)>10,000×g离心30秒,去除流出液。

10)添加200μl的m-washbuffer到柱中,>10,000×g离心30秒。

11)添加200μl的m-desulphonationbuffer到柱中,在室温反应15分钟,反应后,>10,000×g离心30秒。

12)添加200μl的m-washbuffer到柱中。>10,000×g离心30秒。再添加200μl的m-washbuffer并且>10,000×g离心30秒。

13)直接添加12μl的m-elutionbuffer到柱基质中。将柱放置在1.5ml的ep管中,>10,000×g离心洗脱dna。即获得亚硫酸氢盐转化的dna。

3.甲基化pcr检测

采用表2和表3的引物,对阴性参考品和阳性参考品的亚硫酸氢盐转化的dna进行了检测,表2的引物采用常规的甲基化pcr检测体系和条件,常规甲基化pcr检测体系和条件参考文献:imrannawazetal.,epigenetics9:8,1138–1148,2014.,在此不累述。

表3的pap引物的甲基化pcr检测体系总计10μl,包括:10×extaqbuffer(ambion)1μl、160mm的(nh4)2so41μl、2.5mmeach的dntps0.8μl、100×na4ppi(sigma)0.1μl、10u/μl的klentaq-s(scientechcorp)0.2μl、2.5μm的双脱氧修饰primer0.8μl、2.5μm的primer0.8μl、500mm的tris-hcl1μl、50mm的mgcl20.7μl、dna模板和水3.6μl。

其中,双脱氧修饰primer是指经过末端双脱氧碱基修饰的上游引物或下游引物,本例具体的是ndrg4的甲基化下游引物pap或actb的甲基化上游引物pap。primer是指没有经过末端双脱氧碱基修饰的下游引物或上游引物。

表3的pap引物的甲基化pcr的反应条件为,95℃1min,然后进入45个循环:94℃15s、60℃30s、64℃30s、68℃60s、72℃45s。

表2和表3的引物甲基化pcr反应完成后,采用2%凝胶电泳检测pcr产物。

4.结果

pap甲基化特异性pcr体系以亚硫酸氢盐转化后的阳性和阴性参考品dna为模板,以2%凝胶电泳检测pcr产物;结果显示,actb管家基因的pap引物,在阳性参考品和阴性参考品中均有扩增出单一条带,如图3所示;并且,片段大小与预期相符;图3中,第一泳道为100bpladdermarker、第二泳道为阳性参考品、第三泳道为阴性参考品。ndrg4基因的的pap引物,在阳性参考品中有扩增出单一条带,而在阴性参考品和空白对照中都没有扩增条带,并且片段大小与预期相符,如图4所示;图4中,第一泳道为阳性参考品、第二泳道为阴性参考品、第三和第四泳道为水空白对照、第五泳道为50bpladdermarker,水空白对照是指,以水为模板进行pcr扩增的对照。

另外,采用2100检测ndrg4在阳性参考品中的条带,结果如图5所示,结果显示,2100检测的阳性参考品中ndrg4基因的扩增条带大小的确与预期相符,说明所设计的pap甲基化特异性引物对能够对甲基化的ndrg4基因进行特异性扩增。

表2所示的引物中,第一组引物至第八组引物的甲基化特异引物在阳性参考品和结直肠癌的阳性样品中都有扩增出单一条带,在阴性参考品中没有扩增条带,而非甲基化特异引物在阴性参考品中有扩增出条带,与预期相符。结果如图6至图11所示,图6为第五组引物对靶标基因sdc2的检测结果,图7为第六组引物对靶标基因tfpi2的检测结果,图8为第八组引物对靶标基因chfr的检测结果,图6-图8中,第一泳道为100bpladdermarker,第二泳道为甲基化特异引物对阳性参考品的扩增产物,第三泳道为甲基化特异引物对结直肠癌的阳性样品的扩增产物,第四泳道为甲基化特异引物对阴性参考品的扩增产物,第五泳道为非甲基化特异引物对阴性参考品的扩增产物。

图9依序包括sfrp2、alx4和septin9三个靶标基因的扩增结果,其中,第一泳道为100bpladdermarker,第二至第五泳道依序为sfrp2靶标基因的甲基化特异引物对阳性参考品的扩增产物、甲基化特异引物对结直肠癌的阳性样品的扩增产物、甲基化特异引物对阴性参考品的扩增产物、非甲基化特异引物对阴性参考品的扩增产物,第六至第九泳道依序为alx4靶标基因的甲基化特异引物对阳性参考品的扩增产物、甲基化特异引物对结直肠癌的阳性样品的扩增产物、甲基化特异引物对阴性参考品的扩增产物、非甲基化特异引物对阴性参考品的扩增产物,第十至第十三泳道依序为septin9靶标基因的甲基化特异引物对阳性参考品的扩增产物、甲基化特异引物对结直肠癌的阳性样品的扩增产物、甲基化特异引物对阴性参考品的扩增产物、非甲基化特异引物对阴性参考品的扩增产物。

图10为第七组引物对靶标基因ndrg4的检测结果,由于非甲基化特异引物对阴性参考品的扩增产物与甲基化特异引物对阳性参考品、结直肠癌阳性样品等的扩增产物在不同的凝胶块上进行的电泳,因此图10由两部分组成,其中,a图中,第一泳道为100bpladdermarker,第二泳道为甲基化特异引物对阳性参考品的扩增产物,第三泳道为甲基化特异引物对结直肠癌的阳性样品的扩增产物,第四泳道为甲基化特异引物对阴性参考品的扩增产物,b图中,第一泳道为100bpladdermarker,第二泳道为非甲基化特异引物对阴性参考品的扩增产物。

图11为第三组引物对靶标基因rassf2的检测结果,由于点样时靶标基因rassf2的四个扩增产物并非靠近marker,并且是与其它样品一起进行的点样,因此,图11也由两部分组成,其中,a图为截取自rassf2的四个扩增产物同一电泳凝胶块的100bpladdermarker,b图中,第一泳道为甲基化特异引物对阳性参考品的扩增产物,第二泳道为甲基化特异引物对结直肠癌的阳性样品的扩增产物,第三泳道为甲基化特异引物对阴性参考品的扩增产物,第四泳道为空白对照,第五泳道为非甲基化特异引物对阴性参考品的扩增产物。

第九组引物至第十三组引物的甲基化特异引物在阳性参考品和两个肺癌阳性样品中都有扩增出单一条带,在阴性参考品中没有扩增条带,而非甲基化特异引物在阴性参考品中有扩增出条带,与预期相符。部分结果如图12所示,图12为第九组引物对靶标基因ptger4的检测结果,由于点样时靶标基因ptger4的五个扩增产物并非靠近marker,并且是与其它样品一起进行的点样,因此,图12由两部分组成,其中,a图为截取自ptger4的五个扩增产物同一电泳凝胶块的100bpladdermarker,b图中,第一泳道为甲基化特异引物对阳性参考品的扩增产物,第二泳道为甲基化特异引物对肺腺癌的肺癌阳性样品的扩增产物,第三泳道为甲基化特异引物对肺鳞癌的肺癌阳性样品的扩增产物,第四泳道为甲基化特异引物对阴性参考品的扩增产物,第五泳道为非甲基化特异引物对阴性参考品的扩增产物。

以上试验显示,本例设计的septin9、alx4、rassf2、sfrp2、sdc2、tfpi2、ndrg4、chfr、ptger4、tbx5、duox1、csdap1、meis2十三个基因的甲基化检测引物组,能够特异性的对阳性参考品和各自的阳性样品的甲基化进行检测,为基于甲基化检测的结直肠癌和肺癌的早期筛选奠定了基础。

以上内容是结合具体的实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换。

sequencelisting

<110>深圳华大基因股份有限公司

广州华大基因医学检验所有限公司

深圳华大临床检验中心

<120>筛选甲基化pcr检测的目标区域的方法、试剂盒及应用

<130>17i25318

<160>54

<170>patentinversion3.3

<210>1

<211>25

<212>dna

<213>人工序列

<400>1

tattagttattatgtcggatttcgc25

<210>2

<211>21

<212>dna

<213>人工序列

<400>2

caaaatcctctccaacacgtc21

<210>3

<211>28

<212>dna

<213>人工序列

<400>3

gtttattagttattatgttggattttgt28

<210>4

<211>22

<212>dna

<213>人工序列

<400>4

acaaaatcctctccaacacatc22

<210>5

<211>19

<212>dna

<213>人工序列

<400>5

gatttgcgttttttattgc19

<210>6

<211>21

<212>dna

<213>人工序列

<400>6

cgaccgacaaaaaaattatac21

<210>7

<211>22

<212>dna

<213>人工序列

<400>7

tgagatttgtgttttttattgt22

<210>8

<211>24

<212>dna

<213>人工序列

<400>8

acaaccaacaaaaaaattatacca24

<210>9

<211>25

<212>dna

<213>人工序列

<400>9

gtttagtttggttggatttgagttc25

<210>10

<211>25

<212>dna

<213>人工序列

<400>10

ccgtaaaattaaaaaataaaaacgc25

<210>11

<211>24

<212>dna

<213>人工序列

<400>11

ttagtttggttggatttgagtttg24

<210>12

<211>29

<212>dna

<213>人工序列

<400>12

aaaccataaaattaaaaaataaaaacacc29

<210>13

<211>19

<212>dna

<213>人工序列

<400>13

cgtcggttgttagtttttc19

<210>14

<211>19

<212>dna

<213>人工序列

<400>14

ctacaacatcgtaaacgcg19

<210>15

<211>22

<212>dna

<213>人工序列

<400>15

agttgttggttgttagtttttt22

<210>16

<211>22

<212>dna

<213>人工序列

<400>16

accctacaacatcataaacaca22

<210>17

<211>20

<212>dna

<213>人工序列

<400>17

agtcggcgtagttatagcgc20

<210>18

<211>21

<212>dna

<213>人工序列

<400>18

taactcccaaataaacccgaa21

<210>19

<211>28

<212>dna

<213>人工序列

<400>19

tgagtagagttggtgtagttatagtgtg28

<210>20

<211>21

<212>dna

<213>人工序列

<400>20

taactcccaaataaacccaaa21

<210>21

<211>21

<212>dna

<213>人工序列

<400>21

tcgtttggagtagaaagtcgc21

<210>22

<211>24

<212>dna

<213>人工序列

<400>22

cgaaatccataatacaaaaaatcg24

<210>23

<211>23

<212>dna

<213>人工序列

<400>23

ttgtttggagtagaaagttgtgt23

<210>24

<211>25

<212>dna

<213>人工序列

<400>24

caaaatccataatacaaaaaatcaa25

<210>25

<211>22

<212>dna

<213>人工序列

<400>25

gtattttagtcgcgtagaaggc22

<210>26

<211>25

<212>dna

<213>人工序列

<400>26

aatttaacgaatataaacgctcgac25

<210>27

<211>25

<212>dna

<213>人工序列

<400>27

ggtattttagttgtgtagaaggtgg25

<210>28

<211>26

<212>dna

<213>人工序列

<400>28

aaatttaacaaatataaacactcaac26

<210>29

<211>24

<212>dna

<213>人工序列

<400>29

ttttttatgagtgtagatattggc24

<210>30

<211>21

<212>dna

<213>人工序列

<400>30

aaaataaaaacgacgaaacgc21

<210>31

<211>25

<212>dna

<213>人工序列

<400>31

gttttttatgagtgtagatattggt25

<210>32

<211>28

<212>dna

<213>人工序列

<400>32

caaaaaaaaaataaaaacaacaaaacac28

<210>33

<211>19

<212>dna

<213>人工序列

<400>33

cgttagtttatgcgtcgta19

<210>34

<211>25

<212>dna

<213>人工序列

<400>34

aaataaaataaccatctaaatctcg25

<210>35

<211>26

<212>dna

<213>人工序列

<400>35

tatgtattgttagtttatgtgttgta26

<210>36

<211>30

<212>dna

<213>人工序列

<400>36

acaataaataaaataaccatctaaatctca30

<210>37

<211>23

<212>dna

<213>人工序列

<400>37

gaggtttttattcgatcgttttc23

<210>38

<211>21

<212>dna

<213>人工序列

<400>38

ctataccgtctctactacctt21

<210>39

<211>26

<212>dna

<213>人工序列

<400>39

ggagaggtttttatttgattgttttt26

<210>40

<211>26

<212>dna

<213>人工序列

<400>40

caaaactataccatctctactacctt26

<210>41

<211>23

<212>dna

<213>人工序列

<400>41

tattttagttaggtgggatttgg23

<210>42

<211>25

<212>dna

<213>人工序列

<400>42

gaatatccgcgactaaaaaataacg25

<210>43

<211>20

<212>dna

<213>人工序列

<400>43

tattttagttaggtgggatt20

<210>44

<211>26

<212>dna

<213>人工序列

<400>44

aaatatccacaactaaaaaataaaca26

<210>45

<211>19

<212>dna

<213>人工序列

<400>45

agcgaggagtttaagaagc19

<210>46

<211>22

<212>dna

<213>人工序列

<400>46

cgacgacaaaaataaaatcgcg22

<210>47

<211>18

<212>dna

<213>人工序列

<400>47

agtgaggagtttaagaag18

<210>48

<211>22

<212>dna

<213>人工序列

<400>48

acaacaacaaaaataaaatcac22

<210>49

<211>21

<212>dna

<213>人工序列

<400>49

tttcgttttaaggcgtcgttg21

<210>50

<211>19

<212>dna

<213>人工序列

<400>50

ccacctaaaccacgaaccg19

<210>51

<211>22

<212>dna

<213>人工序列

<400>51

ttttgttttaaggtgttgttga22

<210>52

<211>22

<212>dna

<213>人工序列

<400>52

catatacaaaaaccctcacaca22

<210>53

<211>25

<212>dna

<213>人工序列

<400>53

tggtgatggaggaggtttagtaagt25

<210>54

<211>27

<212>dna

<213>人工序列

<400>54

aaccaataaaacctactcctcccttaa27

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1