用于检测肝癌的基因标志物及其用途的制作方法

文档序号:11224237阅读:829来源:国知局

本发明涉及肝癌的临床分子诊断的领域。具体地,本发明涉及通过高通量测序检测肝癌基因标志物的5-羟甲基胞嘧啶含量从而检测肝癌是否存在的方法和试剂盒。



背景技术:

肝癌是最常见的全球恶性肿瘤之一。据世界卫生组织2008年统计,全球每年新发病748300例,死亡695900例,其中50%以上发生在中国。据统计,我国每年新发肝癌40余万例,约85%以上的肝癌患者曾感染乙肝病毒。中国现有慢性乙肝感染者占全球的四分之一,肝癌病例占全世界的一半,慢性肝炎感染带来了的巨大疾病和医疗负.担。

乙肝病毒感染是诱发肝癌的重要因素。实际上,乙型肝炎感染或者肝硬化不仅被视为肿瘤病因学的危险因素,而且还是肿瘤发展的早期/中期(即“癌前状态”),其与导致(通常为良性)非侵袭性赘生物的过度增殖性组织生长(随之可发展为恶性肿瘤如hcc)相关。

目前对于乙肝患者这类肝癌的高危人群,临床主要通过频繁筛查的方式,希望能对肝癌早发现、早治疗。通常要求乙肝患者每半年做一次超声检查,或者检查血液中的甲胎蛋白(afp)含量,以便了解是否转化为肝癌。然而,影像学易受操作者经验影响,并且依赖于设备,费用昂贵,尤其是在医疗资源有限的情况下,其准确率难以保证,难以广泛和常规应用。甲胎蛋白检测灵敏度很难超过60%,但afp对早期肝癌的灵敏度和特异性都不高,例如在一些非肝癌的慢性肝病患者,如很多慢性肝炎和肝硬化患者中,血清afp也升高。这使得多数患者一旦确诊即为肝癌的晚期,失去了最佳的治疗时期。

因此,寻找新的肝癌标志物,尤其是针对乙肝高危人群的肝癌诊断标志物对于提高早期肝癌的诊断率,实现早期干预治疗,降低肝癌病死率具有非常重要的意义。



技术实现要素:

发明人通过对乙肝样品和带有乙肝的肝癌样品进行高通量测序,并对其中各基因上的5-羟甲基胞嘧啶(5-hmc)含量进行分析,出乎意料地发现了多个极具信息的可用于检测肝癌的基因标志物。

因此,本发明的第一个方面涉及针对乙肝患者的用于检测肝癌的基因标志物,包括一个或多个选自以下的基因:骨形成蛋白3(bmp3)、包含布罗莫结构域和phd指的蛋白3(brpf3)、顶盖蛋白1(cpne1)、fc受体样3(fcrl3)、白细胞介素1受体类型2(il1r2)、n-脱乙酰基酶和n-磺基转移酶4(ndst4)、蛋白磷酸酶2支架亚基α(ppp2r1a)、丝氨酸/苏氨酸激酶35(stk35)酪氨酸酶相关蛋白1(tyrp1)、尿苷-胞苷激酶2(uck2)和锌指蛋白254(znf254)。优选的,所述基因标志物包括至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个或至少十一个选自以下的基因:bpm3、brpf3、cpne1、fcrl3、il1r2、ndst4、ppp2r1a、stk35、tyrp1、uck2和znf254。更优选的,所述基因标志物包括bpm3、brpf3、cpne1、fcrl3、il1r2、ndst4、ppp2r1a、stk35、tyrp1、uck2和znf254。

本发明还涉及上述基因标志物在检测肝癌中的用途。

本发明的第二个方面涉及针对乙肝患者的用于检测肝癌的方法,包括以下步骤:

(a)测定乙肝样品和带有乙肝的受试者样品中本发明所述的基因标志物的5-hmc的含量;

(b)用乙肝样品中所述基因标志物的5-hmc含量作为参照,将带有乙肝的受试者样品中对应的基因标志物的5-hmc含量标准化;

(c)对经标准化的所述基因标志物的5-hmc含量进行数学关联,并获得评分;和

(d)根据所述评分p获得检测结果,评分p大于0.5表明所述带有乙肝的受试者样品患有肝癌。

在本发明中,“乙肝样品”是指来自已经确诊感染乙肝病毒但没有患肝癌的患者的样品。“带有乙肝的受试者样品”是指来自已经确认感染乙肝病毒但不知是否患有肝癌的受试者的样品。

在一个实施方案中,所述样品是受试者或乙肝患者体液中游离的dna片段,或来源于细胞器、细胞以及组织中的完整基因组dna。其中,体液是血液、尿液、汗液、痰液、粪便、脑脊液、腹水、胸水、胆汁、胰腺液等。

在一个实施方案中,本发明所述的基因标志物的5-hmc含量可通过本领域技术人员已知的任何方法进行测定,例如包括但不限于,葡糖基化法、限制性内切酶法、化学标记法、与高通量测序方法联用的沉淀法、单分子实时测序法(smrt)、氧化重亚硫酸盐测序法(oxbs-seq)等。葡糖基化法的原理是采用t4噬菌体β-葡萄糖转移酶(β-gt),在葡萄糖供体底物尿核苷二磷酸葡萄糖(udp-glu)存在下,将葡萄糖转移至羟基位置,从而生成β-葡萄糖基-5-羟甲基胞嘧啶(5-ghmc)。同时可采用同位素标记底物进行定量。在葡糖基化法基础上进一步发展出限制性内切酶法和化学标记法。限制性内切酶法的原理是:葡糖基化反应改变了一些限制性内切酶的酶切特性。甲基化依赖的限制性内切酶mspi和hpaii可识别同样的序列(ccgg),但它们对甲基化状态的敏感性是不同:mspi识别并切割5-甲基胞嘧啶(5-mc)和5-hmc,但不能切割5-ghmc;hpaii只切割完全未修饰的位点,胞嘧啶上的任何修饰(5-mc、5-hmc、5-ghmc)均阻碍切割。若cpg位点含有5-hmc,那么糖基化、酶解之后能检测到条带,未糖基化对照反应中没有条带;同时可采用qpcr进行定量分析。另外,其他限制性内切酶也同样存在阻碍5-ghmc酶切的情况,可应用于5-hmc检测(如:gmrsd,mspji,pvurts1i,taqi等)。化学标记法的原理是:将酶反应底物上的葡萄糖进行化学修饰转变成udp-6-n3-glucose,将6-n3-glucose转移到羟甲基位置,生成n3-5ghmc。随后,通过点击化学方法在每个5-hmc上添加一分子生物素,结合下一代高通量dna测序技术或单分子测序技术,可分析5-hmc在基因组dna中的分布情况。沉淀法是将5-hmc用特殊方式修饰后再将其特异性地从基因组dna中捕获下来,并进行测序分析。氧化重亚硫酸盐测序法是首个以单碱基分辨率对5-hmc进行定量测序的方法.首先将5-hmc进行kruo4氧化处理,生成5-甲酰胞嘧啶(5fc),然后采用重亚硫酸盐测序。在此过程中,5-hmc先氧化为5fc,而后脱氨形成u。通常,同时采用多种检测方法对5-hmc进行定量检测。

在本发明的一个实施方案中,利用化学标记法结合高通量测序来测定本发明的基因标志物的5-hmc含量。在该具体的实施方案中,测定本发明的基因标志物的5-hmc含量的方法包括以下步骤:将来自乙肝患者和带有乙肝的受试者的样品的dna片段化;将所述片段化的dna末端修复并末端补齐;将末端补齐的dna与测序接头连接,获得连接产物;通过标记反应对连接产物中的5-羟甲基胞嘧啶进行标记;富集含有5-羟甲基胞嘧啶标记的dna片段,获得富集产物;对富集产物进行pcr扩增,获得测序文库;对测序文库进行高通量测序,获得测序结果;根据测序结果确定5-羟甲基胞嘧啶在基因上的含量。其中,标记反应包括:i)利用糖基转移酶将带有修饰基团的糖共价连接到5-羟甲基胞嘧啶的羟甲基上,和ii)将直接或间接连有生物素的点击化学底物与带有修饰基团的5-羟甲基胞嘧啶反应。其中,步骤i)和步骤ii)可以按顺序进行,也可以在一个反应中同时进行。这种标记方法减少了测序所需的样本量,且5-羟甲基胞嘧啶上的生物素标签使其在测序中显示出更高的动力学信号,提高了核苷酸识别的准确性。在该实施方案中,所述糖基转移酶包括但不限于:t4噬菌体β-葡糖基转移酶(β-gt)、t4噬菌体α-葡糖基转移酶(α-gt)及其具有相同或相似活性的衍生物、类似物、或重组酶;所述带有修饰基团的糖包括但不限于:带有叠氮修饰的糖类(例如6-n3-葡萄糖)或带有其他化学修饰(例如羰基、巯基、羟基、羧基、碳-碳双键、碳-碳三键、二硫键、胺基、酰胺基、双烯等)的糖类,其中优选带有叠氮修饰的糖类;所述用于间接连接生物素和点击化学底物的化学基团包括但不限于:羰基、巯基、羟基、羧基、碳-碳双键、碳-碳三键、二硫键、胺基、酰胺基、双烯。在该实施方案中,优选通过固相材料来富集合有5-hmc标记的dna片段。具体地,可以通过固相亲和反应或其他特异性结合反应将含有5-羟甲基胞嘧啶标记的dna片段结合在固相材料上,然后通过多次洗涤去除未结合的dna片段。固相材料包括但不限于带有表面修饰的硅片或其他芯片,例如人工高分子小球(优选直径为1nm-100um)、磁性小球(优选直径为1nm-100um)、琼脂糖小球等(优选直径为1nm-100um)。固相富集中所用的洗涤液是本领域技术人员熟知的缓冲液,包括但不限于:含有tris-hcl、mops、hepes(ph=6.0-10.0,浓度在1mm到1m之间)、nacl(0-2m)或表面活性剂如tween20(0.01%-5%)的缓冲液。在该实施方案中,优选直接在固相上进行pcr扩增从而制备测序文库。如有需要,在固相上进行pcr扩增后,可以回收扩增产物后进行第二轮pcr扩增来制备测序文库。所述第二轮pcr扩增可用本领域技术人员已知的常规方法进行。任选地,在制备测序文库的过程中可进一步包括一个或多个纯化步骤。本领域技术人员知晓的或可商购的任何纯化试剂盒均可用于本发明。纯化方法包括但不限于:凝胶电泳切胶回收、硅胶膜离心柱法、磁珠法、乙醇或异丙醇沉淀法或其组合。任选地,在高通量测序之前,对测序文库进行质量检查。例如,对文库进行片段大小分析并使用qpcr方法对文库的浓度进行绝对定量。通过质量检查的测序文库可用于高通量测序。然后将一定数量(1-96个)含有不同barcode的文库按相同浓度混匀并根据二代测序仪的标准上机方法上机测序,获得测序结果。本领域已知的各种二代测序平台及其相关的试剂可用于本发明。

在本发明的一个实施方案中,优选将测序结果与标准人类基因组参考序列进行比对,挑选出其中比对到本发明基因标志物上的序列,即选择比对位点与基因特征(如组蛋白修饰位点、转录因子结合位点、基因外显子内含子区域以及基因启动子等)重合区域的读段数量,以代表5-hmc在该基因上的修饰水平,从而测定5-hmc在该基因标志物上的含量。优选在进行比对前,首先将测序结果清除低质量测序位点,其中衡量测序位点质量的因素包括但不限于:碱基质量、reads质量、gc含量、重复序列和overrepresented序列数量等。该步骤中涉及的各种比对软件和分析方法是本领域已知的。

在本发明的一个实施方案中,测定基因标志物的5-hmc含量是指测定该基因标志物全长上的5-hmc含量或测定该基因标志物上某一片段的5-hmc含量或其组合。

根据本发明,在测定各基因标志物上5-hmc含量之后,用乙肝样品中所述基因标志物的5-hmc含量作为参照,将受试者样品中对应的基因标志物的5-hmc含量标准化。举例而言,乙肝样品和受试者样品中同一基因标志物的5-hmc含量分别为x和y,则受试者样品中该基因标志物的标准化5-hmc含量为y/x。

根据本发明,在数据标准化后,对各基因标志物的标准化5-hmc含量进行数学关联以获得评分,从而根据所述评分获得检测结果。如本文所用,“数学关联”是指将来自生物样品的基因标志物的5-hmc含量与肝癌诊断结果相关联的任何计算方法或机器学习方法。本领域普通技术人员理解,可选择不同的计算方法或工具用于提供本发明的数学关联,例如弹性网络正则化、决策树、广义线性模型、逻辑回归、最高分值对、神经网络、线性和二次判别式分析(lqa和qda)、朴素贝叶斯、随机森林和支持向量机。

在本发明的一个实施方案中,对各基因标志物的标准化5-hmc含量进行数学关联并获得评分的具体步骤如下:将各基因标志物的标准化5-hmc含量乘以加权系数,获得该基因标志物的预测因子t;将各基因标志物的预测因子t相加,获得总预测因子t;将总预测因子t经过logistic转换获得评分p;若p>0.5,则该受试者样品患有肝癌;若p≤0.5,则该受试者样品没有肝癌。本文所述的加权系数是指在考虑可能影响5-hmc含量的因素(例如受试者地域、年龄、性别、低于、吸烟史、饮酒史、家族史等)的情况下,通过本领域技术人员已知的各种高级统计分析方法获得的系数。

本发明第三个方面还涉及利用上述基因标志物进行肝癌检测的试剂盒,其包括用于测定上述基因标志物的5-hmc含量的试剂和说明书。用于测定基因标志物的5-hmc含量的试剂是本领域技术人员已知的,例如t4噬菌体β-葡萄糖转移酶和同位素标记(对于葡糖基化法)、限制性内切酶(对于限制性内切酶法)、糖基转移酶和生物素(对于化学标记法)、pcr和测序所用试剂等。

与现有技术相比,本发明中用于检测肝癌的方法是基于基因标志物上的5-hmc含量,因此可以使用更为广泛的dna样品来源。因此,本发明中用于检测肝癌的方法具有以下几个优点:(1)安全无创,即使无症状人群也对该检测接受度高;(2)dna来源广泛,不存在影像学中的检测盲区;(3)准确性高,对早期肝癌有较高的灵敏度和特异性,适合用于肝癌的早期筛查;(4)操作方便,用户体验好,容易进行乙肝高危人群的动态监测。本发明的基因标志物可与其他临床指标相结合,为肝癌筛查、诊断、治疗与预后提供更准确的判断。

附图说明

图1:用本发明的肝癌基因标志物区分乙肝样品和带有乙肝的肝癌样品的结果。

具体实施方式

下面将参考附图并结合实施例来详细说明本发明,以使本领域的技术人员可以更好的理解本发明并能予以实施。需要说明的是,本领域的技术人员应该理解本发明的附图及其实施例仅仅是为了说明的目的,并不能对本发明构成任何限制。在不矛盾的情况下,本申请中的实施例及实施例中的特征可以相互组合。

实施例1.肝癌基因标志物的筛选

(1)抽提血浆dna:

从20个带有乙肝的肝癌样品和20个乙肝样品中分别抽提10ng血浆dna。可利用本领域技术人员所熟知的任何适用于抽提血浆dna的方法、和试剂进行此步骤。

(2)将血浆dna进行末端补齐、悬a并与测序接头连接:

根据kapahyperperpkit说明书制备含有50ul血浆dna、7ulendrepair&a-tailingbuffer和3ulendrepair&a-tailingenzymemix的反应混合液(总体积为60ul),在20℃温浴30分钟,然后在65℃温浴30分钟。在1.5ml低吸附ep管中配置以下连接反应混合物:5ulnucleasefreewater,30ulligationbuffer以及10uldnaligase。向45ul连接反应混合物中加入5ul的测序接头,混合,于20℃加热20分钟,然后保持于4℃。使用ampurexpbeads对反应产物进行纯化,用20ul含tris-hcl(10mm,ph=8.0)及edta(0.1mm)的缓冲液进行洗脱获得最终的dna连接样品。

(3)标记5-羟甲基胞嘧啶:

制备总体积为26ul的标记反应混合液:叠氮修饰的二磷酸尿苷葡萄糖(即udp-n3-glu,终浓度为50um)、β-gt(终浓度为1um)、mg2+(终浓度为25mm)、hepes(ph=8.0,终浓度为50mm)和来自上述步骤的20uldna。将混合液在37℃温浴1小时。取出混合液,用ampurexpbeads纯化,获得纯化的20uldna。

然后在上述纯化的20uldna中加入1ul连接有生物素的二苯基环辛炔(dbco-biotin),于37℃反应2小时,接着用ampurexpbeads纯化,获得纯化的标记产物。

(4)固相富集含有标记的5-羟甲基胞嘧啶的dna片段:

首先,按以下步骤准备磁珠:取出0.5ulc1streptadvinbeads(lifetechnology)并加入100ul缓冲液(5mmtris,ph=7.5,1mnacl,0.02%tween20),涡旋混合30秒,然后用100ul洗涤液(5mmtris,ph=7.5,1mnacl,0.02%tween20)洗涤磁珠3次,最后加入25ul结合缓冲液(10mmtris,ph=7.5,2mnacl,0.04%tween20或其他表面活性剂),并混合均匀。

然后,在磁珠混合液中加入上述步骤获得的纯化的标记产物,并在旋转混合器中混合15min使其充分结合。

最后,用100ul洗涤液(5mmtris,ph=7.5,1mnacl,0.02%tween20)洗涤磁珠3次,离心去掉上清液,加入23.75ul不含核酸酶的水。

(5)pcr扩增:

向上述步骤的最终体系中加入25ul的2xpcrmastermix和1.25ulpcr引物(总体积为50ul),按照下述pcr反应循环的温度和条件进行扩增:

将扩增产物用ampurexpbeads纯化,得到最终测序文库。

(6)对测序文库进行质检后进行高通量测序:

将获得的测序文库通过qpcr进行浓度测定,并用agilent2100对文库中dna片段大小含量进行确定。将通过质检的测序文库以相同浓度混合,用illuminahiseq4000进行测序。

(7)确定各基因标志物的5-hmc含量和加权系数

将获得的测序结果进行初步质控评估,清除低质量测序位点后,将达到测序质量标准的读段利用bowtie2工具与人类标准基因组参考序列进行比较。然后利用featurecounts和htseq-count工具来统计读段数量以确定各基因标志物的5-hmc含量。同时利用高通量测序结果,将可能影响5-hmc含量的因素作为共变量,通过逻辑回归和弹性网络正则化获得各基因标志物的加权系数。结果如表1所示。

表1:本发明的肝癌基因标志物的平均标准化5-hmc含量和加权系数

如上所述,平均标准化5-hmc含量是指带乙肝的肝癌样品中该基因标志物的平均5-hmc含量与乙肝样品中同一基因标志物的平均5-hmc含量之比。从表1可以看出,本发明的肝癌基因标志物的5-hmc含量在乙肝样品中和带乙肝的肝癌样品中存在显著差异,并且除bmp3、fcrl3、ndst4和tyrp1之外,其余基因标志物的5-hmc含量相对于正常人均显著增加。

实施例2.肝癌基因标志物的有效性

本实施例验证本发明的肝癌基因标志物用于检测肝癌的有效性。

根据实施例1的方法测定110个样品(60例带乙肝的肝癌样品和50例乙肝样品)中本发明所述的11个肝癌基因标志物的5-hmc含量,并确定各基因标志物的加权系数。

将各基因标志物的标准化5-hmc含量乘以与其对应的加权系数,获得该基因标志物的预测因子t后,将各基因标志物的预测因子t相加,获得总预测因子t,然后将总预测因子t根据以下公式经过logistic转换获得评分p:

若p>0.5,则该受试者样品患有肝癌;若p≤0.5,则该受试者样品没有肝癌。

图1示出了根据本发明的方法区分该批样品的结果。如图1所示,本发明的方法能够达到88%的灵敏度和90%的特异性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1