一种用于检测食管癌的基因标志物及其用途和检测方法与流程

文档序号:14590173发布日期:2018-06-02 06:31阅读:370来源:国知局
本发明属于食管癌的临床分子诊断
技术领域
,具体地说本发明涉及一种通过高通量测序检测食管癌基因标志物的5-羟甲基胞嘧啶含量从而检测食管癌是否存在的方法和试剂盒。
背景技术
:食管癌作为我国恶性肿瘤发病率最高的癌症之一已经越来越被人们重视。食管癌的发病因素有很多,目前公认的有饮酒和吸烟是对食管造成损伤的各类慢性刺激,以及环境因素是中国食管鳞癌发病的主要原因。调查发现,喜欢吃烫食、超量饮酒、低收人、低体质指数、既往食管病变、不按时就餐、喜食辣食及肿瘤家族史等均是增加食管癌患病风险的因素。我国食管癌一直以食管鳞癌为主,近些年食管腺癌的发病率未见明显增长,食管鳞癌已成为我国卫生部确定的十大特色肿瘤之一。据世界卫生组织公布的最新资料显示,2008年度全世界67亿人口新发食管癌48.2万例,发病率为7/10万,居全部恶性肿瘤第9位;死亡40.7万例,死亡率5.8/10万,居第8位。中国大陆13.4亿人口食管癌新发25.9万例,发病率为16.7/10万,居全国各类恶性肿瘤第5位;死亡21.1万例,死亡率为13.4/10万,居第4位。按性别统计,我国男性食管癌患者17.6万,发病率为22.9/10万;死亡14.4万,死亡率18.7/10万;女性患者8.3万,发病率为10.5/10万,死亡6.7万,死亡率8.2/10万,男性发病率居各类恶性肿瘤第4位,女性居第7位,而死亡率男女均居第4位。它的预后和患者的TNM分期密切相关,I期食管癌患者的5年生存率为50%~80%,而Ⅲ、Ⅳ期患者的5年生存率仅为5%~15%,因此早期诊断和准确分期就成为提高食管癌患者生存率的关键因素。目前食管癌的检测方法主要是通过影像学、组织活检、血清学检测等。然而,影像学易受操作者经验的影响,并且依赖于设备,费用昂贵,尤其是在医疗资源有限的情况下,其准确率难以保证,难以广泛和常规应用。随着在各级医院的普遍以及高危人群的随访和定期复查的完善,内镜检查已逐步成为食管癌筛查的首选方法,但常规内镜检查时早期食管癌仍容易漏诊。组织活检是目前临床上确诊食管癌的金标准,但组织活检存在着很大的局限性,例如手术取样的困难,或者某些癌症部位不便于进行穿刺,并且穿刺本身也会带来一定的临床风险,反复穿刺筛查更会给患者带来巨大痛苦。用于临床的食管癌血清肿瘤标志物为鳞状细胞癌抗原(SCC-Ag)、癌胚抗原(CEA)、细胞角蛋白19片段(CYFRA21-1)和P53抗体等。但这些血清标志物对于早期食管癌的灵敏度和特异性都不高,往往在肿瘤发生转移后才会升高。肿瘤标志物由于其具有简便性,而且基本无创,如果在准确性上能有所突破,则可能会大幅提高食管癌的早期诊断率,最终实现降低食管癌患者病死率的目的。但目前现有技术中缺乏简单有效,尤其是适用于人群普查的诊断方法,所以寻找新的食管癌早期诊断标志物意义重大。技术实现要素:本发明为了克服现有技术存在的不足,提供一种用于检测食管癌的基因标志物及其用途和检测方法。本发明是通过以下技术方案实现的:一种用于检测食管癌的基因标志物,该基因标志物包括一个或多个选自以下的基因:磷脂肌醇磷酸酯酶CX域包含蛋白3、硫酸酯酶1、F-Box和富亮氨酸重复蛋白7、Tolloid类蛋白1、RNA结合模板单链作用蛋白质3、ADAMTS类蛋白1、磷酸二酯酶10A、LIM域连接酶2、伽马-氨基丁酸A型受体蛋白伽马3亚族和序列相似性155家族蛋白成员A。该基因标志物的用途在于用做检测食管癌。本发明检测食管癌的方法具体包括以下步骤:(a)测定正常样品和受试者样品中基因标志物中5-hmC的含量;(b)用正常样品中基因标志物的5-hmC含量作为参照,将受试者样品中对应的基因标志物的5-hmC含量标准化;(c)对步骤(b)中经标准化的基因标志物的5-hmC含量进行数学关联,并获得评分P;(d)根据评分P获得检测结果,评分P>0.5表明该受试者样品患有食管癌。步骤(a)是测定基因标志物全长或其片段上的5-hmC的含量。其中样品是来自正常人或受试者体液中游离的DNA片段,或者来源于细胞器、细胞以及组织中的完整基因组DNA,体液是血液、尿液、汗液、痰液、粪便、脑脊液、腹水、胸水、胆汁或食管液。本发明还公开了一种用于检测食管癌的试剂盒,该试剂盒包括用于测定基因标志物的5-hmC含量的试剂和说明书,其中5-hmC含量是指基因标志物全长或其片段上的5-hmC的含量。申请人通过对正常样品和食管癌样品进行高通量测序,并对其中各基因上的5-羟甲基胞嘧啶(5-hmC)含量进行分析,出乎意料地发现了多个极具信息的可用于检测食管癌的基因标志物。因此,本发明的第一个方面涉及用于检测食管癌的基因标志物,该基因标志物包括一个或多个选自以下的基因:磷脂肌醇磷酸酯酶CX域包含蛋白3(PLCXD3)、硫酸酯酶1(SULF1)、F-Box和富亮氨酸重复蛋白7(FBXL7)、Tolloid类蛋白1(TLL1)、RNA结合模板单链作用蛋白质3(RBMS3)、ADAMTS类蛋白1(ADAMTSL1)、磷酸二酯酶10A(PDE10A)、LIM域连接酶2(LDB2)、伽马-氨基丁酸A型受体蛋白伽马3亚族(GABRG3)和序列相似性155家族蛋白成员A(FAM155A)。优选的,基因标志物包括至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个选自以下的基因:PLCXD3、SULF1、FBXL7、TLL1、RBMS3、ADAMTSL1、PDE10A、LDB2、GABRG3和FAM155A。最佳的,基因标志物包括PLCXD3、SULF1、FBXL7、TLL1、RBMS3、ADAMTSL1、PDE10A、LDB2、GABRG3和FAM155A。本发明还涉及上述基因标志物在检测食管癌中的用途。本发明的第二个方面涉及用于检测食管癌的方法,包括以下步骤:(a)测定正常样品和受试者样品中本发明的基因标志物的5-hmC的含量;(b)用正常样品中基因标志物的5-hmC含量作为参照,将受试者样品中对应的基因标志物的5-hmC含量标准化;(c)对经标准化的基因标志物的5-hmC含量进行数学关联,并获得评分;(d)根据评分获得检测结果。在一个实施方案中,样品是受试者或正常人体液中游离的DNA片段,或来源于细胞器、细胞以及组织中的完整基因组DNA。其中体液是血液、尿液、汗液、痰液、粪便、脑脊液、腹水、胸水、胆汁或食管液等。在一个实施方案中,本发明的基因标志物的5-hmC含量可通过本领域技术人员已知的任何方法进行测定,例如包括但不限于葡糖基化法、限制性内切酶法、化学标记法、与高通量测序方法联用的沉淀法、单分子实时测序法(SMRT)、氧化重亚硫酸盐测序法(OxBS-Seq)等。葡糖基化法的原理是采用T4噬菌体β-葡萄糖转移酶(β-GT),在葡萄糖供体底物尿核苷二磷酸葡萄糖(UDP-Glu)存在下,将葡萄糖转移至羟基位置,从而生成β-葡萄糖基-5-羟甲基胞嘧啶(5-ghmC)。同时采用同位素标记底物进行定量,在葡糖基化法的基础上进一步发展出限制性内切酶法和化学标记法。限制性内切酶法的原理是:葡糖基化反应改变了一些限制性内切酶的酶切特性。甲基化依赖的限制性内切酶MspI和HpaII可识别同样的序列(CCGG),但它们对甲基化状态的敏感性不同:MspI识别并切割5-甲基胞嘧啶(5-mC)和5-hmC,但不能切割5-ghmC;HpaII只切割完全未修饰的位点,胞嘧啶上的任何修饰(5-mC、5-hmC、5-ghmC)均阻碍切割。若CpG位点含有5-hmC,那么糖基化、酶解之后能检测到条带,未糖基化对照反应中没有条带;同时可采用qPCR进行定量分析。另外,其他限制性内切酶也同样存在阻碍5-ghmC酶切的情况,可应用于5-hmC检测(如:GmrSD、MspJI、PvuRts1I、TaqI等)。化学标记法的原理是:将酶反应底物上的葡萄糖进行化学修饰转变成UDP-6-N3-glucose,将6-N3-glucose转移到羟甲基位置,生成N3-5ghmC。随后通过点击化学方法在每个5-hmC上添加一分子生物素,结合下一代高通量DNA测序技术或单分子测序技术,可分析5-hmC在基因组DNA中的分布情况。沉淀法是将5-hmC用特殊方式修饰后再将其特异性地从基因组DNA中捕获下来,并进行测序分析。氧化重亚硫酸盐测序法是首个以单碱基分辨率对5-hmC进行定量测序的方法,首先将5-hmC进行KRuO4氧化处理,生成5-甲酰胞嘧啶(5fC),然后采用重亚硫酸盐测序。在此过程中,5-hmC先氧化为5fC,而后脱氨形成U。通常,同时采用多种检测方法对5-hmC进行定量检测。在本发明的一个实施方案中,利用化学标记法结合高通量测序来测定本发明基因标志物的5-hmC含量。在该具体的实施方案中,测定本发明的基因标志物5-hmC含量的方法具体包括以下步骤:将来自食管癌患者和正常人的样品的DNA片段化;将片段化的DNA末端修复并末端补齐;将末端补齐的DNA与测序接头连接,获得连接产物;通过标记反应对连接产物中的5-羟甲基胞嘧啶进行标记;富集含有5-hmC标记的DNA片段,获得富集产物;对富集产物进行PCR扩增,获得测序文库;对测序文库进行高通量测序,获得测序结果;根据测序结果确定5-hmC在基因上的含量。标记反应包括:i)利用糖基转移酶将带有修饰基团的糖共价连接到5-hmC的羟甲基上,ii)将直接或间接连有生物素的点击化学底物与带有修饰基团的5-hmC反应。其中步骤i)和步骤ii)可以按顺序进行,也可以在一个反应中同时进行。这种标记方法减少了测序所需的样本量,且5-hmC上的生物素标签使其在测序中显示出更高的动力学信号,提高了核苷酸识别的准确性。在该实施方案中,糖基转移酶包括但不限于:T4噬菌体β-葡糖基转移酶(β-GT)、T4噬菌体α-葡糖基转移酶(α-GT)及其具有相同或相似活性的衍生物、类似物或重组酶;带有修饰基团的糖包括但不限于:带有叠氮修饰的糖类(6-N3-葡萄糖)或带有其他化学修饰(如羰基、巯基、羟基、羧基、碳-碳双键、碳-碳三键、二硫键、胺基、酰胺基、双烯等)的糖类,其中优选带有叠氮修饰的糖类;用于间接连接生物素和点击化学底物的化学基团包括但不限于:羰基、巯基、羟基、羧基、碳-碳双键、碳-碳三键、二硫键、胺基、酰胺基、双烯。在该实施方案中,优选通过固相材料来富集含有5-hmC标记的DNA片段。具体地,可以通过固相亲和反应或其他特异性结合反应将含有5-hmC标记的DNA片段结合在固相材料上,然后通过多次洗涤去除未结合的DNA片段。固相材料包括但不限于带有表面修饰的硅片或其他芯片,例如人工高分子小球、磁性小球、琼脂糖小球等。固相富集中所用的洗涤液是本领域技术人员熟知的缓冲液,包括但不限于:含有Tris-HCl、MOPS、HEPES(pH=6-10)、NaCl或表面活性剂如Tween20(0.01%~5%)的缓冲液。在该实施方案中,优选直接在固相上进行PCR扩增从而制备测序文库。如有需要,在固相上进行PCR扩增后,可以回收扩增产物后进行第二轮PCR扩增来制备测序文库。第二轮PCR扩增可用本领域技术人员已知的常规方法进行,任选地,在制备测序文库的过程中可进一步包括一个或多个纯化步骤。本领域技术人员知晓的或可商购的任何纯化试剂盒均可用于本发明。纯化方法包括但不限于凝胶电泳切胶回收、硅胶膜离心柱法、磁珠法、乙醇或异丙醇沉淀法或其组合。任选地,在高通量测序之前,对测序文库进行质量检查。例如,对文库进行片段大小分析并使用qPCR方法对文库的浓度进行绝对定量。通过质量检查的测序文库可用于高通量测序。然后将一定数量(1~96个)含有不同barcode的文库按相同浓度混匀并根据二代测序仪的标准上机方法上机测序,获得测序结果。本领域已知的各种二代测序平台及其相关的试剂可用于本发明。在本发明的一个实施方案中,优选将测序结果与标准人类基因组参考序列进行比对,挑选出其中比对到本发明基因标志物上的序列,即选择比对位点与基因特征(如组蛋白修饰位点、转录因子结合位点、基因外显子内含子区域以及基因启动子等)重合区域的读段数量,以代表5-hmC在该基因上的修饰水平,从而测定5-hmC在该基因标志物上的含量。优选在进行比对前,首先将测序结果清除低质量测序位点,其中衡量测序位点质量的因素包括但不限于:碱基质量、reads质量、GC含量、重复序列和Overrepresented序列数量等。该步骤中涉及的各种比对软件和分析方法是本领域已知的。在本发明的一个实施方案中,测定基因标志物的5-hmC含量是指测定该基因标志物全长上的5-hmC含量或测定该基因标志物上某一片段的5-hmC含量或其组合。根据本发明,在测定各基因标志物上5-hmC含量之后,用正常样品中基因标志物的5-hmC含量作为参照,将受试者样品中对应的基因标志物的5-hmC含量标准化。例如:正常样品和受试者样品中同一基因标志物的5-hmC含量分别为X和Y,则受试者样品中该基因标志物的标准化5-hmC含量为Y/X。根据本发明,在数据标准化后,对各基因标志物的标准化5-hmC含量进行数学关联以获得评分,从而根据评分获得检测结果。如本发明所用,“数学关联”是指将来自生物样品的基因标志物的5-hmC含量与食管癌诊断结果相关联的任何计算方法或机器学习方法。本领域普通技术人员理解,可选择不同的计算方法或工具用于提供本发明的数学关联,例如弹性网络正则化、决策树、广义线性模型、逻辑回归、最高分值对、神经网络、线性和二次判别式分析(LQA和QDA)、朴素贝叶斯、随机森林和支持向量机。在本发明的一个实施方案中,对各基因标志物的标准化5-hmC含量进行数学关联并获得评分的具体步骤如下:将各基因标志物的标准化5-hmC含量乘以加权系数,获得该基因标志物的预测因子t;将各基因标志物的预测因子t相加,获得总预测因子T;将总预测因子T经过Logistic转换获得评分P;若P>0.5,则该受试者样品患有食管癌;若P≤0.5,则该受试者样品为正常。本发明的加权系数是指在考虑可能影响5-hmC含量的因素(例如受试者地域、年龄、性别、低于、吸烟史、饮酒史、家族史等)的情况下,通过本领域技术人员已知的各种高级统计分析方法获得的系数。本发明第三个方面还涉及利用上述基因标志物进行食管癌检测的试剂盒,其包括用于测定上述基因标志物的5-hmC含量的试剂和说明书。用于测定基因标志物的5-hmC含量的试剂是本领域技术人员已知的,例如T4噬菌体β-葡萄糖转移酶和同位素标记(对于葡糖基化法)、限制性内切酶(对于限制性内切酶法)、糖基转移酶和生物素(对于化学标记法)、PCR和测序所用试剂等。本发明的有益效果是:本发明涉及用于检测食管癌的基因标志物及其用途,还涉及使用该基因标志物对食管癌进行检测的方法。与现有技术相比,本发明用于检测食管癌的方法是基于基因标志物上的5-hmC含量,因此可以使用更为广泛的DNA样品来源。本发明用于检测食管癌的方法还具有以下几个优点:(1)安全无创,即使无症状人群也对该检测接受度高;(2)DNA来源广泛,不存在影像学中的检测盲区;(3)准确性高,对早期食管癌有较高的灵敏度和特异性,适合用于食管癌的早期筛查;(4)操作方便,用户体验好,容易进行食管癌复发和转移的动态监测。本发明中的基因标志物可与其他临床指标相结合,为食管癌的筛查、诊断、治疗与预后提供更准确的判断。附图说明图1是用本发明食管癌基因标志物区分食管癌样品和健康对照的结果图。具体实施方式以下结合附图和具体实施例对本发明作详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施。本领域的技术人员应该理解,本发明的附图及其实施例仅仅是为了说明的目的,并不能对本发明构成任何限制,在不矛盾的情况下,本申请中的实施例及实施例中的特征可以相互组合。实施例1:食管癌基因标志物的筛选:(1)抽提血浆DNA:从来自20位食管癌患者和20位正常人的样品中分别抽提10ng血浆DNA。可利用本领域技术人员所熟知的任何适用于抽提血浆DNA的方法、和试剂进行此步骤。(2)将血浆DNA进行末端补齐、悬A并与测序接头连接:根据KapaHyperPerpKit说明书制备含有50uL血浆DNA、7uLEndRepair&A-TailingBuffer和3uLEndRepair&A-TailingEnzymemix的反应混合液(总体积为60uL),在20℃温浴30min,然后在65℃温浴30min。在1.5mL低吸附EP管中配置以下连接反应混合物:5uLNucleasefreewater,30uLLigationBuffer以及10uLDNALigase。向45uL连接反应混合物中加入5uL的测序接头,混合,于20℃加热20min,然后保持于4℃。使用AmpureXPbeads对反应产物进行纯化,用20uL含Tris-HCl(10mM,pH=8.0)及EDTA(0.1mM)的缓冲液进行洗脱获得最终的DNA连接样品。(3)标记5-hmC:制备总体积为26uL的标记反应混合液:叠氮修饰的二磷酸尿苷葡萄糖(即UDP-N3-Glu,终浓度为50uM)、β-GT(终浓度为1uM)、Mg2+(终浓度为25mM)、HEPES(pH=8.0,终浓度为50mM)和来自上述步骤的20uLDNA。将混合液在37℃温浴1小时。取出混合液,用AmpureXPbeads纯化,获得纯化的20uLDNA。然后在上述纯化的20uLDNA中加入1uL连接有生物素的二苯基环辛炔(DBCO-Biotin),于37℃反应2小时,接着用AmpureXPbeads纯化,获得纯化的标记产物。(4)固相富集含有标记的5-羟甲基胞嘧啶的DNA片段:首先,按以下步骤准备磁珠:取出0.5uLC1streptadvinbeads(lifetechnology)并加入100uL缓冲液(5mMTris,pH=7.5,1MNaCl,0.02%Tween20)涡旋混合30s,然后用100uL洗涤液(5mMTrispH=7.5,1MNaCl,0.02%Tween20)洗涤磁珠3次,最后加入25uL结合缓冲液(10mMTris,pH=7.5,2MNaCl,0.04%Tween20或其他表面活性剂),并混合均匀。然后,在磁珠混合液中加入上述步骤获得的纯化的标记产物,并在旋转混合器中混合15min使其充分结合。最后,用100uL洗涤液(5mMTris,pH=7.5,1MNaCl,0.02%Tween20)洗涤磁珠3次,离心去掉上清液,加入23.75uL不含核酸酶的水。(5)PCR扩增:向上述步骤的最终体系中加入25uL的2XPCRmastermix和1.25uLPCR引物(总体积为50uL),按照下述PCR反应循环的温度和条件进行扩增,将扩增产物用AmpureXPbeads纯化,得到最终测序文库。(6)对测序文库进行质检后进行高通量测序:将获得的测序文库通过qPCR进行浓度测定,并用Agilent2100对文库中DNA片段大小含量进行确定。将通过质检的测序文库以相同浓度混合,用IlluminaHiseq4000进行测序。(7)确定各基因标志物的5-hmC含量和加权系数:将获得的测序结果进行初步质控评估,清除低质量测序位点后,将达到测序质量标准的读段利用Bowtie2工具与人类标准基因组参考序列进行比较。然后利用featureCounts和HtSeq-Count工具来统计读段数量以确定各基因标志物的5-hmC含量。同时利用高通量测序结果,将可能影响5-hmC含量的因素作为共变量,通过逻辑回归和弹性网络正则化获得各基因标志物的加权系数,结果如表1所示。表1:本发明的食管癌基因标志物的平均标准化5-hmC含量和加权系数正式符号平均标准化5-hmC含量p值(FDR)加权系数基因ID基因名称PLCXD31.161.63E-060.84345557磷脂肌醇磷酸酯酶CX域包含蛋白3SULF11.183.72E-060.2623213硫酸酯酶1FBXL70.937.32E-060.4523194F-Box和富亮氨酸重复蛋白7TLL11.162.85E-060.887092Tolloid类蛋白1RBMS31.171.61E-060.3927303RNA结合模板单链作用蛋白质3ADAMTSL10.894.38E-05-0.2092949ADAMTS类蛋白1PDE10A1.136.09E-050.5910846磷酸二酯酶10ALDB21.191.68E-05-0.179079LIM域连接酶2GABRG31.141.25E-050.632567伽马-氨基丁酸A型受体蛋白伽马3亚族FAM155A1.171.09E-050.35728215序列相似性155家族蛋白成员A如上,平均标准化5-hmC含量是指食管癌样品中该基因标志物的平均5-hmC含量与正常样品中同一基因标志物的平均5-hmC含量之比。从表1可以看出,本发明的食管癌基因标志物的5-hmC含量在正常样品中和食管癌样品中存在显著差异,并且除ADAMTSL1、LDB2之外,其余基因标志物的5-hmC含量相对于正常人均显著增加。实施例2:食管癌基因标志物的有效性:本实施例用于验证本发明的食管癌基因标志物用于检测食管癌的有效性。根据实施例1的方法测定第一批82个样品(41例食管癌和107例健康对照)中本发明的10个食管癌基因标志物的5-hmC含量。将各基因标志物的标准化5-hmC含量乘以该标志物在实施例1中对应的加权系数,获得该基因标志物的预测因子t,之后将各基因标志物的预测因子t相加,获得总预测因子T,然后将总预测因子T根据以下公式经过Logistic转换获得评分P:P=1/(1+e-T),若P>0.5,则该受试者样品患有食管癌;若P≤0.5,则该受试者样品为正常。图1中示出了根据本发明的方法区分该批样品的结果,如图1所示,本发明的方法能够达到90%的灵敏度和92%的特异性。最后应当说明的是,以上内容仅用以说明本发明的技术方案,而非对本发明保护范围的限制,本领域的普通技术人员对本发明的技术方案进行的简单修改或者等同替换,均不脱离本发明技术方案的实质和范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1