用于检测肝癌的基因标志物及其用途的制作方法

文档序号:11246426阅读:518来源:国知局
用于检测肝癌的基因标志物及其用途的制造方法与工艺

本发明涉及肝癌的临床分子诊断的领域。具体地,本发明涉及通过高通量测序检测肝癌基因标志物的5-羟甲基胞嘧啶含量从而检测肝癌是否存在的方法和试剂盒。



背景技术:

肝癌是最常见的全球恶性肿瘤之一。据世界卫生组织2008年统计,全球每年新发病748300例,死亡695900例,其中50%以上发生在中国。在原发性肝癌中,70%-85%为肝细胞肝癌(hcc)。目前,肝癌的5年生存率仅3%-5%,因为大部分患者就诊时已属中晚期,失去了最佳治疗时间。因此,早检查早诊断早治疗是提高患者生存质量、延长生存期的关键。

目前肝癌的检测主要通过影像学、组织活检、血清学检测等。然而,影像学易受操作者经验影响,并且依赖于设备,费用昂贵,尤其是在医疗资源有限的情况下,其准确率难以保证,难以广泛和常规应用。组织活检是目前临床上确诊肝癌的金标准,但组织活检存在很大局限性,例如手术取样的困难,或者某些癌症部位不便进行穿刺,并且穿刺本身也会带来一定的临床风险,反复穿刺筛查更会给患者带来巨大痛苦。血清学检测目前应用最广的是对甲胎蛋白(afp)的检测,但afp对早期肝癌的灵敏度和特异性都不高,例如在一些非肝癌的慢性肝病患者,如很多慢性肝炎和肝硬化患者中,血清afp也升高。

在对肝癌的早期筛查中,难度最大的是对小肝癌的筛查。小肝癌又称为亚临床肝癌或早期肝癌,临床上无明显肝癌症状和体征,一般指肝细胞癌中单个癌结节最大直径不超过3厘米或两个癌结节直径之和不超过3厘米的肝癌。我国的小肝癌标准是:单个癌结节最大直径不超过3厘米;多个癌结节数目不超过两个,其最大直径总和应小于3厘米。小肝癌的手术切除率高达93.6%,预后较好,生存率较高。因此早期筛查出小肝癌具有重要的临床意义。目前对小肝癌的筛查也主要采取超声检查、影像学诊断与血清甲胎蛋白检测等方法。但如上所述,这些传统方法对于小肝癌诊断的准确率和特异性不高。

因此,寻找新的肝癌标志物,尤其是预警监测和早期诊断的标志物是对于提高早期肝癌的诊断率,实现早期干预治疗,降低肝癌病死率具有非常重要的意义。



技术实现要素:

发明人通过对正常样品和肝癌样品进行高通量测序,并对其中各基因上的5-羟甲基胞嘧啶(5-hmc)含量进行分析,出乎意料地发现了多个极具信息的可用于检测肝癌的基因标志物。

因此,本发明的第一个方面涉及用于检测肝癌的基因标志物,包括一个或多个选自以下的基因:fat非典型钙粘蛋白1(fat1)、雌激素相关受体γ(esrrg)、γ氨基丁酸a类受体β3亚基(gabrb3)、tnf受体超家族成员11b(tnfrsf11b)、受体互作丝氨酸/苏氨酸激酶4(ripk4)、重排的l-myc融合蛋白(rlf)、溶质载体家族13成员5(slc13a5)、细胞色素p450氧化还原酶(por)和deltexe3泛素连接酶(dtx1)。优选的,所述基因标志物包括至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个或至少九个选自以下的基因:fat1、esrrg、gabrb3、tnfrsf11b、ripk4、rlf、slc13a5、por和dtx1。更优选的,所述基因标志物包括fat1、esrrg、gabrb3、tnfrsf11b、ripk4、rlf、slc13a5、por和dtx1。

本发明还涉及上述基因标志物在检测肝癌中的用途。

本发明的第二个方面涉及用于检测肝癌的方法,包括以下步骤:

(a)测定正常样品和受试者样品中本发明所述的基因标志物的5-hmc的含量;

(b)用正常样品中所述基因标志物的5-hmc含量作为参照,将受试者样品中对应的基因标志物的5-hmc含量标准化;

(c)对经标准化的所述基因标志物的5-hmc含量进行数学关联,并获得评分;和

(d)根据所述评分获得检测结果,评分p大于0.5表明该受试者样品患有肝癌。

在一个实施方案中,所述样品是受试者或正常人体液中游离的dna片段,或来源于细胞器、细胞以及组织中的完整基因组dna。其中,体液是血液、尿液、汗液、痰液、粪便、脑脊液、腹水、胸水、胆汁、胰腺液等。

在一个实施方案中,本发明所述的基因标志物的5-hmc含量可通过本领域技术人员已知的任何方法进行测定,例如包括但不限于,葡糖基化法、限制性内切酶法、化学标记法、与高通量测序方法联用的沉淀法、单分子实时测序法(smrt)、氧化重亚硫酸盐测序法(oxbs-seq)等。葡糖基化法的原理是采用t4噬菌体β-葡萄糖转移酶(β-gt),在葡萄糖供体底物尿核苷二磷酸葡萄糖(udp-glu)存在下,将葡萄糖转移至羟基位置,从而生成β-葡萄糖基-5-羟甲基胞嘧啶(5-ghmc)。同时可采用同位素标记底物进行定量。在葡糖基化法基础上进一步发展出限制性内切酶法和化学标记法。限制性内切酶法的原理是:葡糖基化反应改变了一些限制性内切酶的酶切特性。甲基化依赖的限制性内切酶mspi和hpaii可识别同样的序列(ccgg),但它们对甲基化状态的敏感性是不同:mspi识别并切割5-甲基胞嘧啶(5-mc)和5-hmc,但不能切割5-ghmc;hpaii只切割完全未修饰的位点,胞嘧啶上的任何修饰(5-mc、5-hmc、5-ghmc)均阻碍切割。若cpg位点含有5-hmc,那么糖基化、酶解之后能检测到条带,未糖基化对照反应中没有条带;同时可采用qpcr进行定量分析。另外,其他限制性内切酶也同样存在阻碍5-ghmc酶切的情况,可应用于5-hmc检测(如:gmrsd,mspji,pvurtsli,taqi等)。化学标记法的原理是:将酶反应底物上的葡萄糖进行化学修饰转变成udp-6-n3-glucose,将6-n3-glucose转移到羟甲基位置,生成n3-5ghmc。随后,通过点击化学方法在每个5-hmc上添加一分子生物素,结合下一代高通量dna测序技术或单分子测序技术,可分析5-hmc在基因组dna中的分布情况。沉淀法是将5-hmc用特殊方式修饰后再将其特异性地从基因组dna中捕获下来,并进行测序分析。氧化重亚硫酸盐测序法是首个以单碱基分辨率对5-hmc进行定量测序的方法.首先将5-hmc进行kruo4氧化处理,生成5-甲酰胞嘧啶(5fc),然后采用重亚硫酸盐测序。在此过程中,5-hmc先氧化为5fc,而后脱氨形成u。通常,同时采用多种检测方法对5-hmc进行定量检测。

在本发明的一个实施方案中,利用化学标记法结合高通量测序来测定本发明的基因标志物的5-hmc含量。在该具体的实施方案中,测定本发明的基因标志物的5-hmc含量的方法包括以下步骤:将来自肝癌患者和正常人的样品的dna片段化;将所述片段化的dna末端修复并末端补齐;将末端补齐的dna与测序接头连接,获得连接产物;通过标记反应对连接产物中的5-羟甲基胞嘧啶进行标记;富集含有5-羟甲基胞嘧啶标记的dna片段,获得富集产物;对富集产物进行pcr扩增,获得测序文库;对测序文库进行高通量测序,获得测序结果;根据测序结果确定5-羟甲基胞嘧啶在基因上的含量。其中,标记反应包括:i)利用糖基转移酶将带有修饰基团的糖共价连接到5-羟甲基胞嘧啶的羟甲基上,和ii)将直接或间接连有生物素的点击化学底物与带有修饰基团的5-羟甲基胞嘧啶反应。其中,步骤i)和步骤ii)可以按顺序进行,也可以在一个反应中同时进行。这种标记方法减少了测序所需的样本量,且5-羟甲基胞嘧啶上的生物素标签使其在测序中显示出更高的动力学信号,提高了核苷酸识别的准确性。在该实施方案中,所述糖基转移酶包括但不限于:t4噬菌体β-葡糖基转移酶(β-gt)、t4噬菌体α-葡糖基转移酶(α-gt)及其具有相同或相似活性的衍生物、类似物、或重组酶;所述带有修饰基团的糖包括但不限于:带有叠氮修饰的糖类(例如6-n3-葡萄糖)或带有其他化学修饰(例如羰基、巯基、羟基、羧基、碳-碳双键、碳-碳三键、二硫键、胺基、酰胺基、双烯等)的糖类,其中优选带有叠氮修饰的糖类;所述用于间接连接生物素和点击化学底物的化学基团包括但不限于:羰基、巯基、羟基、羧基、碳-碳双键、碳-碳三键、二硫键、胺基、酰胺基、双烯。在该实施方案中,优选通过固相材料来富集含有5-hmc标记的dna片段。具体地,可以通过固相亲和反应或其他特异性结合反应将含有5-羟甲基胞嘧啶标记的dna片段结合在固相材料上,然后通过多次洗涤去除未结合的dna片段。固相材料包括但不限于带有表面修饰的硅片或其他芯片,例如人工高分子小球(优选直径为1nm-100um)、磁性小球(优选直径为1nm-100um)、琼脂糖小球等(优选直径为1nm-100um)。固相富集中所用的洗涤液是本领域技术人员熟知的缓冲液,包括但不限于:含有tris-hcl、mops、hepes(ph=6.0-10.0,浓度在1mm到1m之间)、nacl(o-2m)或表面活性剂如tween20(0.01%-5%)的缓冲液。在该实施方案中,优选直接在固相上进行pcr扩增从而制备测序文库。如有需要,在固相上进行pcr扩增后,可以回收扩增产物后进行第二轮pcr扩增来制备测序文库。所述第二轮pcr扩增可用本领域技术人员已知的常规方法进行。任选地,在制备测序文库的过程中可进一步包括一个或多个纯化步骤。本领域技术人员知晓的或可商购的任何纯化试剂盒均可用于本发明。纯化方法包括但不限于:凝胶电泳切胶回收、硅胶膜离心柱法、磁珠法、乙醇或异丙醇沉淀法或其组合。任选地,在高通量测序之前,对测序文库进行质量检查。例如,对文库进行片段大小分析并使用qpcr方法对文库的浓度进行绝对定量。通过质量检查的测序文库可用于高通量测序。然后将一定数量(1-96个)含有不同barcode的文库按相同浓度混匀并根据二代测序仪的标准上机方法上机测序,获得测序结果。本领域已知的各种二代测序平台及其相关的试剂可用于本发明。

在本发明的一个实施方案中,优选将测序结果与标准人类基因组参考序列进行比对,挑选出其中比对到本发明基因标志物上的序列,即选择比对位点与基因特征(如组蛋白修饰位点、转录因子结合位点、基因外显子内含子区域以及基因启动子等)重合区域的读段数量,以代表5-hmc在该基因上的修饰水平,从而测定5-hmc在该基因标志物上的含量。优选在进行比对前,首先将测序结果清除低质量测序位点,其中衡量测序位点质量的因素包括但不限于:碱基质量、reads质量、gc含量、重复序列和overrepresented序列数量等。该步骤中涉及的各种比对软件和分析方法是本领域已知的。

在本发明的一个实施方案中,测定基因标志物的5-hmc含量是指测定该基因标志物全长上的5-hmc含量或测定该基因标志物上某一片段的5-hmc含量或其组合。

根据本发明,在测定各基因标志物上5-hmc含量之后,用正常样品中所述基因标志物的5-hmc含量作为参照,将受试者样品中对应的基因标志物的5-hmc含量标准化。举例而言,正常样品和受试者样品中同一基因标志物的5-hmc含量分别为x和y,则受试者样品中该基因标志物的标准化5-hmc含量为y/x。

根据本发明,在数据标准化后,对各基因标志物的标准化5-hmc含量进行数学关联以获得评分,从而根据所述评分获得检测结果。如本文所用,“数学关联”是指将来自生物样品的基因标志物的5-hmc含量与肝癌诊断结果相关联的任何计算方法或机器学习方法。本领域普通技术人员理解,可选择不同的计算方法或工具用于提供本发明的数学关联,例如弹性网络正则化、决策树、广义线性模型、逻辑回归、最高分值对、神经网络、线性和二次判别式分析(lqa和qda)、朴素贝叶斯、随机森林和支持向量机。

在本发明的一个实施方案中,对各基因标志物的标准化5-hmc含量进行数学关联并获得评分的具体步骤如下:将各基因标志物的标准化5-hmc含量乘以加权系数,获得该基因标志物的预测因子t;将各基因标志物的预测因子t相加,获得总预测因子t;将总预测因子t经过logistic转换获得评分p;若p>0.5,则该受试者样品患有肝癌;若p≤0.5,则该受试者样品为正常。本文所述的加权系数是指在考虑可能影响5-hmc含量的因素(例如受试者地域、年龄、性别、低于、吸烟史、饮酒史、家族史等)的情况下,通过本领域技术人员已知的各种高级统计分析方法获得的系数。

本发明第三个方面还涉及利用上述基因标志物进行肝癌检测的试剂盒,其包括用于测定上述基因标志物的5-hmc含量的试剂和说明书。用于测定基因标志物的5-hmc含量的试剂是本领域技术人员已知的,例如t4噬菌体β-葡萄糖转移酶和同位素标记(对于葡糖基化法)、限制性内切酶(对于限制性内切酶法)、糖基转移酶和生物素(对于化学标记法)、pcr和测序所用试剂等。

与现有技术相比,本发明中用于检测肝癌的方法是基于基因标志物上的5-hmc含量,因此可以使用更为广泛的dna样品来源。因此,本发明中用于检测肝癌的方法具有以下几个优点:(1)安全无创,即使无症状人群也对该检测接受度高;(2)dna来源广泛,不存在影像学中的检测盲区;(3)准确性高,对早期肝癌有较高的灵敏度和特异性,适合用于肝癌的早期筛查;(4)操作方便,用户体验好,容易进行肝癌复发和转移的动态监测。本发明的基因标志物可与其他临床指标相结合,为肝癌筛查、诊断、治疗与预后提供更准确的判断。

附图说明

图1:用本发明的肝癌基因标志物区分肝癌样品和健康对照的结果。

图2:用本发明的肝癌基因标志物区分小肝癌样品和健康对照的结果。

具体实施方式

下面将参考附图并结合实施例来详细说明本发明,以使本领域的技术人员可以更好的理解本发明并能予以实施。需要说明的是,本领域的技术人员应该理解本发明的附图及其实施例仅仅是为了说明的目的,并不能对本发明构成任何限制。在不矛盾的情况下,本申请中的实施例及实施例中的特征可以相互组合。

实施例1.肝癌基因标志物的筛选

(1)抽提血浆dna:

从来自20位肝癌患者和20位正常人的样品中分别抽提10ng血浆dna。可利用本领域技术人员所熟知的任何适用于抽提血浆dna的方法、和试剂进行此步骤。

(2)将血浆dna进行末端补齐、悬a并与测序接头连接:

根据kapahyperperpkit说明书制备含有50ul血浆dna、7ulendrepair&a-tailingbuffer和3ulendrepair&a-tailingenzymemix的反应混合液(总体积为60ul),在20℃温浴30分钟,然后在65℃温浴30分钟。在1.5ml低吸附ep管中配置以下连接反应混合物:5ulnucleasefreewater,30ulligationbuffer以及10uldnaligase。向45ul连接反应混合物中加入5ul的测序接头,混合,于20℃加热20分钟,然后保持于4℃。使用ampurexpbeads对反应产物进行纯化,用20ul含tris-hcl(10mm,ph=8.0)及edta(0.1mm)的缓冲液进行洗脱获得最终的dna连接样品。

(3)标记5-羟甲基胞嘧啶:

制备总体积为26ul的标记反应混合液:叠氮修饰的二磷酸尿苷葡萄糖(即udp-n3-glu,终浓度为50um)、β-gt(终浓度为1um)、mg2+(终浓度为25mm)、hepes(ph=8.0,终浓度为50mm)和来自上述步骤的20uldna。将混合液在37℃温浴1小时。取出混合液,用ampurexpbeads纯化,获得纯化的20uldna。

然后在上述纯化的20uldna中加入1ul连接有生物素的二苯基环辛炔(dbco-biotin),于37℃反应2小时,接着用ampurexpbeads纯化,获得纯化的标记产物。

(4)固相富集含有标记的5-羟甲基胞嘧啶的dna片段:

首先,按以下步骤准备磁珠:取出0.5ulc1streptadvinbeads(lifetechnology)并加入100ul缓冲液(5mmtris,ph=7.5,1mnacl,0.02%tween20),涡旋混合30秒,然后用100ul洗涤液(5mmtris,ph=7.5,1mnacl,0.02%tween20)洗涤磁珠3次,最后加入25ul结合缓冲液(10mmtris,ph=7.5,2mnacl,0.04%tween20或其他表面活性剂),并混合均匀。

然后,在磁珠混合液中加入上述步骤获得的纯化的标记产物,并在旋转混合器中混合15min使其充分结合。

最后,用100ul洗涤液(5mmtris,ph=7.5,1mnacl,0.02%tween20)洗涤磁珠3次,离心去掉上清液,加入23.75ul不含核酸酶的水。

(5)pcr扩增:

向上述步骤的最终体系中加入25ul的2xpcrmastermix和1.25ulpcr引物(总体积为50ul),按照下述pcr反应循环的温度和条件进行扩增:

将扩增产物用ampurexpbeads纯化,得到最终测序文库。

(6)对测序文库进行质检后进行高通量测序:

将获得的测序文库通过qpcr进行浓度测定,并用agilent2100对文库中dna片段大小含量进行确定。将通过质检的测序文库以相同浓度混合,用illuminahiseq4000进行测序。

(7)确定各基因标志物的5-hmc含量和加权系数

将获得的测序结果进行初步质控评估,清除低质量测序位点后,将达到测序质量标准的读段利用bowtie2工具与人类标准基因组参考序列进行比较。然后利用featurecounts和htseq-count工具来统计读段数量以确定各基因标志物的5-hmc含量。同时利用高通量测序结果,将可能影响5-hmc含量的因素作为共变量,通过逻辑回归和弹性网络正则化获得各基因标志物的加权系数。结果如表1所示。

表1:本发明的肝癌基因标志物的平均标准化5-hmc含量和加权系数

如上所述,平均标准化5-hmc含量是指肝癌样品中该基因标志物的平均5-hmc含量与正常样品中同一基因标志物的平均5-hmc含量之比。从表1可以看出,本发明的肝癌基因标志物的5-hmc含量在正常样品中和肝癌样品中存在显著差异,并且除rlf之外,其余基因标志物的5-hmc含量相对于正常人均显著增加。

实施例2.肝癌基因标志物的有效性

本实施例验证本发明的肝癌基因标志物用于检测肝癌的有效性。

根据实施例1的方法测定第一批96个样品(50例肝癌和46例健康对照)中本发明所述的9个肝癌基因标志物的5-hmc含量,并确定各基因标志物的加权系数。

将各基因标志物的标准化5-hmc含量乘以与其对应的加权系数,获得该基因标志物的预测因子t后,将各基因标志物的预测因子t相加,获得总预测因子t,然后将总预测因子t根据以下公式经过logistic转换获得评分p:

若p>0.5,则该受试者样品患有肝癌;若p≤0.5,则该受试者样品为正常。

图1示出了根据本发明的方法区分该批样品的结果。如图1所示,本发明的方法能够达到90%的灵敏度和91%的特异性。

此外,还使用本发明的9个肝癌基因标志物筛查小肝癌。如图2所示,在42例小肝癌患者和42例健康对照的样品中,使用本发明的肝癌基因标志物筛查小肝癌仍然具有83%左右的灵敏度和83%左右的特异性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1