用于检测肝肿瘤良恶性的基因标志物、试剂盒及检测方法与流程

文档序号:12996544阅读:365来源:国知局
本发明涉及肝肿瘤良恶性的临床分子诊断
技术领域
。具体的,本发明涉及用于检测肝肿瘤良恶性的基因标志物、试剂盒及肝肿瘤良恶性的检测方法。
背景技术
:肿瘤分良性肿瘤和恶性肿瘤两大类。良性肿瘤生长缓慢,除在要害部位占位有影响外,一般对健康和生命没有危害。恶性肿瘤生长迅速,与人体争夺营养,产生有害代谢产物,破坏人体正常器官组织结构,对人体健康极为有害,如不及时进行有效治疗将会夺人生命。常见的肝良性肿瘤有肝细胞腺瘤、肝管细胞腺瘤、肾上腺残余瘤、血管瘤、错构瘤等。肝恶性肿瘤就是指肝细胞肝癌,即我们通常讲的肝癌。肝癌是最常见的全球恶性肿瘤之一。据世界卫生组织2008年统计,全球每年新发病748300例,死亡695900例,其中50%以上发生在中国。良性肿瘤与恶性肿瘤二者在细胞形态、组织结构、生长方式、增长速度和对人体影响等方面均有本质的不同,所以治疗方式上也不一样。把恶性肿瘤当作良性肿瘤治疗就会贻误病人。反之,若把良性肿瘤当作恶性肿瘤治疗,不仅造成病人精神上负担,而且由于采取许多不必要的治疗手段,致使病人遭受痛苦和损失。但某些良性肿瘤和恶性肿瘤有着相近似的生长形式,给诊断造成很大的困难。如有的良性肿瘤生长较快,状似恶性肿瘤;而有的恶性肿瘤有可能生长缓慢很象良性肿瘤。甚至有的肿瘤本身就具有良性恶性的两种特点,虽然肿瘤细胞表现为良性,而且有完整包膜,但它是多中心性生长,治疗后较一般良性肿瘤复发率高,就其临床的某些特点来看很似恶性肿瘤,固称之为临界性肿瘤。此外,某些良性肿瘤在其发展过程中有变为恶性的可能,也要引起临床的重视。因此,针对肝良性肿瘤和恶性肿瘤寻找诊断标志物,提高对肝良性肿瘤与恶性肿瘤区分鉴别能力,对临床诊断具有非常重要的意义。技术实现要素:本发明通过对良性肝肿瘤样品与肝癌样品进行高通量测序,并对其中各基因上的5-羟甲基胞嘧啶(5-hmc)含量进行分析,出乎意料地发现了多个极具信息的可用于检测肝肿瘤良恶性的基因标志物。因此,本发明的第一个方面涉及用于检测肝肿瘤良恶性的基因标志物,包括一个或两个以上以下基因:fat非典型钙粘蛋白1(fat1)、雌激素相关受体γ(esrrg)、性别决定基因y染色体区域盒家族成员9(sox9)、纤毛状络合物子单元1(evc)、1号染色体开放阅读框125抗体(axdnd1)、络丝蛋白(reln)、转铁蛋白(tf)、tnf受体超家族成员(tnfrsf11b)、胰腺和十二指肠同圆框1(pdx1)、α-酸性糖蛋白2(orm2)。优选的,所述基因标志物包括fat1、esrrg、sox9、evc、axdnd1、reln、tf、tnfrsf11b、pdx1和orm2。本发明还涉及上述基因标志物在检测肝肿瘤良恶性中的用途,通过高通量测序检测肺癌基因标志物中5-羟甲基胞嘧啶的含量,从而判定肝肿瘤的良性。本发明的第二个方面涉及用于检测肝肿瘤良恶性的方法,包括以下步骤:a)测定良性肝肿瘤样品和肝癌受试者样品中本发明所述的基因标志物的5-hmc的含量;b)用良性肝肿瘤样品中所述基因标志物的5-hmc含量作为参照,将肝癌受试者样品中对应的基因标志物的5-hmc含量标准化;c)对经标准化的所述基因标志物的5-hmc含量进行数学关联,并获得评分;d)根据所述评分获得区分结果。在一个实施方案中,所述样品是受试者体液中游离的dna片段,或来源于细胞器、细胞以及组织中的完整基因组dna。其中,体液是血液、尿液、汗液、痰液、粪便、脑脊液、腹水、胸水、胆汁、胰腺液等。在一个实施方案中,本发明所述的基因标志物的5-hmc含量可通过本领域技术人员已知的任何方法进行测定,例如包括但不限于,葡糖基化法、限制性内切酶法、化学标记法、与高通量测序方法联用的沉淀法、单分子实时测序法(smrt)、氧化重亚硫酸盐测序法(oxbs-seq)等。葡糖基化法的原理是采用t4噬菌体β-葡萄糖转移酶(β-gt),在葡萄糖供体底物尿核苷二磷酸葡萄糖(udp-glu)存在下,将葡萄糖转移至羟基位置,从而生成β-葡萄糖基-5-羟甲基胞嘧啶(5-ghmc)。同时可采用同位素标记底物进行定量。在葡糖基化法基础上进一步发展出限制性内切酶法和化学标记法。限制性内切酶法的原理是:葡糖基化反应改变了一些限制性内切酶的酶切特性。甲基化依赖的限制性内切酶mspi和hpaii可识别同样的序列(ccgg),但它们对甲基化状态的敏感性是不同:mspi识别并切割5-甲基胞嘧啶(5-mc)和5-hmc,但不能切割5-ghmc;hpaii只切割完全未修饰的位点,胞嘧啶上的任何修饰(5-mc、5-hmc、5-ghmc)均阻碍切割。若cpg位点含有5-hmc,那么糖基化、酶解之后能检测到条带,未糖基化对照反应中没有条带;同时可采用qpcr进行定量分析。另外,其他限制性内切酶也同样存在阻碍5-ghmc酶切的情况,可应用于5-hmc检测(如:gmrsd,mspji,pvurts1i,taqi等)。化学标记法的原理是:将酶反应底物上的葡萄糖进行化学修饰转变成udp-6-n3-glucose,将6-n3-glucose转移到羟甲基位置,生成n3-5ghmc。随后,通过点击化学方法在每个5-hmc上添加一分子生物素,结合下一代高通量dna测序技术或单分子测序技术,可分析5-hmc在基因组dna中的分布情况。沉淀法是将5-hmc用特殊方式修饰后再将其特异性地从基因组dna中捕获下来,并进行测序分析。氧化重亚硫酸盐测序法是首个以单碱基分辨率对5-hmc进行定量测序的方法.首先将5-hmc进行kruo4氧化处理,生成5-甲酰胞嘧啶(5fc),然后采用重亚硫酸盐测序。在此过程中,5-hmc先氧化为5fc,而后脱氨形成u。通常,同时采用多种检测方法对5-hmc进行定量检测。在本发明的一个实施方案中,利用化学标记法结合高通量测序来测定本发明的基因标志物的5-hmc含量。在该具体的实施方案中,测定本发明的基因标志物的5-hmc含量的方法包括以下步骤:将来自肝癌患者和良性肝肿瘤患者的dna片段化;将所述片段化的dna末端修复并末端补齐;将末端补齐的dna与测序接头连接,获得连接产物;通过标记反应对连接产物中的5-羟甲基胞嘧啶进行标记;富集含有5-羟甲基胞嘧啶标记的dna片段,获得富集产物;对富集产物进行pcr扩增,获得测序文库;对测序文库进行高通量测序,获得测序结果;根据测序结果确定5-羟甲基胞嘧啶在基因上的含量。其中,标记反应包括:i)利用糖基转移酶将带有修饰基团的糖共价连接到5-羟甲基胞嘧啶的羟甲基上,和ii)将直接或间接连有生物素的点击化学底物与带有修饰基团的5-羟甲基胞嘧啶反应。其中,步骤i)和步骤ii)可以按顺序进行,也可以在一个反应中同时进行。这种标记方法减少了测序所需的样本量,且5-羟甲基胞嘧啶上的生物素标签使其在测序中显示出更高的动力学信号,提高了核苷酸识别的准确性。在该实施方案中,所述糖基转移酶包括但不限于:t4噬菌体β-葡糖基转移酶(β-gt)、t4噬菌体α-葡糖基转移酶(α-gt)及其具有相同或相似活性的衍生物、类似物、或重组酶;所述带有修饰基团的糖包括但不限于:带有叠氮修饰的糖类(例如6-n3-葡萄糖)或带有其他化学修饰(例如羰基、巯基、羟基、羧基、碳-碳双键、碳-碳三键、二硫键、胺基、酰胺基、双烯等)的糖类,其中优选带有叠氮修饰的糖类;所述用于间接连接生物素和点击化学底物的化学基团包括但不限于:羰基、巯基、羟基、羧基、碳-碳双键、碳-碳三键、二硫键、胺基、酰胺基、双烯。在该实施方案中,优选通过固相材料来富集含有5-hmc标记的dna片段。具体地,可以通过固相亲和反应或其他特异性结合反应将含有5-羟甲基胞嘧啶标记的dna片段结合在固相材料上,然后通过多次洗涤去除未结合的dna片段。固相材料包括但不限于带有表面修饰的硅片或其他芯片,例如人工高分子小球(优选直径为1nm-100um)、磁性小球(优选直径为1nm-100um)、琼脂糖小球等(优选直径为1nm-100um)。固相富集中所用的洗涤液是本领域技术人员熟知的缓冲液,包括但不限于:含有tris-hcl、mops、hepes(ph=6.0-10.0,浓度在1mm到1m之间)、nacl(0-2m)或表面活性剂如tween20(0.01%-5%)的缓冲液。在该实施方案中,优选直接在固相上进行pcr扩增从而制备测序文库。如有需要,在固相上进行pcr扩增后,可以回收扩增产物后进行第二轮pcr扩增来制备测序文库。所述第二轮pcr扩增可用本领域技术人员已知的常规方法进行。任选地,在制备测序文库的过程中可进一步包括一个或多个纯化步骤。本领域技术人员知晓的或可商购的任何纯化试剂盒均可用于本发明。纯化方法包括但不限于:凝胶电泳切胶回收、硅胶膜离心柱法、磁珠法、乙醇或异丙醇沉淀法或其组合。任选地,在高通量测序之前,对测序文库进行质量检查。例如,对文库进行片段大小分析并使用qpcr方法对文库的浓度进行绝对定量。通过质量检查的测序文库可用于高通量测序。然后将一定数量(1-96个)含有不同barcode的文库按相同浓度混匀并根据二代测序仪的标准上机方法上机测序,获得测序结果。本领域已知的各种二代测序平台及其相关的试剂可用于本发明。在本发明的一个实施方案中,优选将测序结果与标准人类基因组参考序列进行比对,挑选出其中比对到本发明基因标志物上的序列,即选择比对位点与基因特征(如组蛋白修饰位点、转录因子结合位点、基因外显子内含子区域以及基因启动子等)重合区域的读段数量,以代表5-hmc在该基因上的修饰水平,从而测定5-hmc在该基因标志物上的含量。优选在进行比对前,首先将测序结果清除低质量测序位点,其中衡量测序位点质量的因素包括但不限于:碱基质量、reads质量、gc含量、重复序列和overrepresented序列数量等。该步骤中涉及的各种比对软件和分析方法是本领域已知的。在本发明的一个实施方案中,测定基因标志物的5-hmc含量是指测定该基因标志物全长上的5-hmc含量或测定该基因标志物上某一片段的5-hmc含量或其组合。根据本发明,在测定各基因标志物上5-hmc含量之后,用良性肝肿瘤样品中所述基因标志物的5-hmc含量作为参照,将肝癌受试者样品中对应的基因标志物的5-hmc含量标准化。举例而言,良性肝肿瘤样品和肝癌受试者样品中同一基因标志物的5-hmc含量分别为x和y,则肝癌受试者样品中该基因标志物的标准化5-hmc含量为y/x。根据本发明,在数据标准化后,对各基因标志物的标准化5-hmc含量进行数学关联以获得评分,从而根据所述评分获得检测结果。如本文所用,“数学关联”是指将来自生物样品的基因标志物的5-hmc含量与肝肿瘤诊断结果相关联的任何计算方法或机器学习方法。本领域普通技术人员理解,可选择不同的计算方法或工具用于提供本发明的数学关联,例如弹性网络正则化、决策树、广义线性模型、逻辑回归、最高分值对、神经网络、线性和二次判别式分析(lqa和qda)、朴素贝叶斯、随机森林和支持向量机。在本发明的一个实施方案中,对各基因标志物的标准化5-hmc含量进行数学关联并获得评分的具体步骤如下:将各基因标志物的标准化5-hmc含量乘以加权系数,获得该基因标志物的预测因子t;将各基因标志物的预测因子t相加,获得总预测因子t;将总预测因子t经过logistic转换获得评分p;若p>0.5,则该受试者样品患有肝癌;若p≤0.5,则该受试者患有良性肝肿瘤。本文所述的加权系数是指在考虑可能影响5-hmc含量的因素(例如受试者地域、年龄、性别、低于、吸烟史、饮酒史、家族史等)的情况下,通过本领域技术人员已知的各种高级统计分析方法获得的系数。本发明第三个方面还涉及利用上述基因标志物进行肝肿瘤良恶性检测的试剂盒,其包括用于测定上述基因标志物的5-hmc含量的试剂和说明书。用于测定基因标志物的5-hmc含量的试剂是本领域技术人员已知的,例如t4噬菌体β-葡萄糖转移酶和同位素标记(对于葡糖基化法)、限制性内切酶(对于限制性内切酶法)、糖基转移酶和生物素(对于化学标记法)、pcr和测序所用试剂等。与现有技术相比,本发明检测肝肿瘤良恶性的方法是基于基因标志物上的5-hmc含量,因此可以使用更为广泛的dna样品来源。因此,本发明具有以下几个优点:(1)安全无创,即使无症状人群也对该检测接受度高;(2)dna来源广泛,不存在影像学中的检测盲区;(3)准确性高,对肝癌有较高的灵敏度和特异性,更适用于肝肿瘤良恶性的区分;(4)操作方便,用户体验好,容易进行肝肿瘤发展的动态监测。本发明的基因标志物可与其他临床指标相结合,为肝肿瘤后续的筛查、诊断、治疗提供更准确的判断。附图说明图1是本发明区恶性肝肿瘤样品和良性肝肿瘤样品对照的曲线图。具体实施方式下面结合实施例及附图对本发明进行详细说明,以使本领域技术人员更好的理解本发明,并能予以实施。实施例1.肝肿瘤基因标志物的筛选1)抽提血浆dna:从来自20位肝癌患者和20位良性肝肿瘤患者的样品中分别抽提10ng血浆dna。可利用本领域技术人员所熟知的任何适用于抽提血浆dna的方法、和试剂进行此步骤。2)将血浆dna进行末端补齐、悬a并与测序接头连接:根据kapahyperperpkit说明书制备含有50ul血浆dna、7ulendrepair&a-tailingbuffer和3ulendrepair&a-tailingenzymemix的反应混合液(总体积为60ul),在20℃温浴30分钟,然后在65℃温浴30分钟。在1.5ml低吸附ep管中配置以下连接反应混合物:5ulnucleasefreewater,30ulligationbuffer以及10uldnaligase。向45ul连接反应混合物中加入5ul的测序接头,混合,于20℃加热20分钟,然后保持于4℃。使用ampurexpbeads对反应产物进行纯化,用20ul含tris-hcl(10mm,ph=8.0)及edta(0.1mm)的缓冲液进行洗脱获得最终的dna连接样品。3)标记5-羟甲基胞嘧啶:制备总体积为26ul的标记反应混合液:叠氮修饰的二磷酸尿苷葡萄糖(即udp-n3-glu,终浓度为50um)、β-gt(终浓度为1um)、mg2+(终浓度为25mm)、hepes(ph=8.0,终浓度为50mm)和来自上述步骤的20uldna。将混合液在37℃温浴1小时。取出混合液,用ampurexpbeads纯化,获得纯化的20uldna。然后在上述纯化的20uldna中加入1ul连接有生物素的二苯基环辛炔(dbco-biotin),于37℃反应2小时,接着用ampurexpbeads纯化,获得纯化的标记产物。4)固相富集含有标记的5-羟甲基胞嘧啶的dna片段:首先,按以下步骤准备磁珠:取出0.5ulc1streptadvinbeads(lifetechnology)并加入100ul缓冲液(5mmtris,ph=7.5,1mnacl,0.02%tween20),涡旋混合30秒,然后用100ul洗涤液(5mmtris,ph=7.5,1mnacl,0.02%tween20)洗涤磁珠3次,最后加入25ul结合缓冲液(10mmtris,ph=7.5,2mnacl,0.04%tween20或其他表面活性剂),并混合均匀。然后,在磁珠混合液中加入上述步骤获得的纯化的标记产物,并在旋转混合器中混合15min使其充分结合。最后,用100ul洗涤液(5mmtris,ph=7.5,1mnacl,0.02%tween20)洗涤磁珠3次,离心去掉上清液,加入23.75ul不含核酸酶的水。5)pcr扩增:向上述步骤的最终体系中加入25ul的2xpcrmastermix和1.25ulpcr引物(总体积为50ul),按照下述pcr反应循环的温度和条件进行扩增:将扩增产物用ampurexpbeads纯化,得到最终测序文库。6)对测序文库进行质检后进行高通量测序:将获得的测序文库通过qpcr进行浓度测定,并用agilent2100对文库中dna片段大小含量进行确定。将通过质检的测序文库以相同浓度混合,用illuminahiseq4000进行测序。7)确定各基因标志物的5-hmc含量和加权系数:将获得的测序结果进行初步质控评估,清除低质量测序位点后,将达到测序质量标准的读段利用bowtie2工具与人类标准基因组参考序列进行比较。然后利用featurecounts和htseq-count工具来统计读段数量以确定各基因标志物的5-hmc含量。同时利用高通量测序结果,将可能影响5-hmc含量的因素作为共变量,通过逻辑回归和弹性网络正则化获得各基因标志物的加权系数。结果如表1所示。表1:本发明的肝肿瘤基因标志物的平均标准化5-hmc含量和加权系数正式符号平均标准化5-hmc含量p值(fdr)加权系数基因id基因名称sox91.469.02e-101.666662性别决定基因y区域盒成员9esrrg1.348.42e-090.572104雌激素相关受体γevc1.277.56e-070.912121纤毛状络合物子单元1axdnd11.233.42e-060.291268591号染色体开放阅读框125抗体fat11.361.59e-070.272195fat非典型钙粘蛋白1reln1.269.05e-060.225649络丝蛋白tf1.261.75e-05-0.467018转铁蛋白tnfrsf11b1.361.59e-080.474982tnf受体超家族成员11bpdx11.381.59e-070.573651胰腺和十二指肠同圆框1orm21.244.60e-052.455005α-酸性糖蛋白2如上所述,平均标准化5-hmc含量是指肝癌样品中该基因标志物的平均5-hmc含量与良性肝肿瘤样品中同一基因标志物的平均5-hmc含量之比。从表1可以看出,本发明的肝肿瘤基因标志物的5-hmc含量在良性肝肿瘤样品中和肝癌样品中存在显著差异。实施例2.肝肿瘤基因标志物的有效性本实施例验证本发明的肝肿瘤基因标志物用于区分肝肿瘤良恶性的有效性。根据实施例1的方法测定第一批164个样品(82例肝癌和82例良性肝肿瘤)中本发明所述的10个肝癌基因标志物的5-hmc含量。将各基因标志物的标准化5-hmc含量乘以该标志物在实施例1中对应的加权系数,获得该基因标志物的预测因子t,之后将各基因标志物的预测因子t相加,获得总预测因子t,然后将总预测因子t根据以下公式经过logistic转换获得评分p:若p>0.5,则该受试者样品患有肝癌;若p≤0.5,则该受试者患有良性肝肿瘤。图1示出了根据本发明的方法区分该批样品的结果。如图1所示,本发明的方法能够达到95%的灵敏度和96%的特异性。最后应当说明的是,以上内容仅用以说明本发明的技术方案,而非对本发明保护范围的限制,本领域的普通技术人员对本发明的技术方案进行的简单修改或者等同替换,均不脱离本发明技术方案的实质和范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1