确定生物样本是否源自肝癌组织的方法与流程

文档序号:30795613发布日期:2022-07-16 17:07阅读:173来源:国知局
确定生物样本是否源自肝癌组织的方法与流程

1.本发明涉及用于确定未知来源的生物样本是否源自肝癌组织的方法,以及用于执行该方法的包含肝癌组织特异性dna甲基化标记物的组合物。


背景技术:

2.人体内的细胞具有相同的遗传信息,但每个细胞的功能和形状却非常多样。这是因为每个细胞中都表达了特定的基因,因此细胞分化过程不同,导致细胞表型不同。几个因素,如dna甲基化、组蛋白修饰、组织特异性转录因子都参与了这些特定基因的表达。具体而言,dna甲基化,特别是cpg位点的甲基化,是细胞特异性基因表达的基本要素,并且已知对每个细胞或组织具有独特的dna甲基化特征。因此,使用dna甲基化特征可以很容易地识别细胞或组织的来源。
3.识别细胞或组织的来源可以实现疾病的早期诊断并提高诊断的准确性。例如,循环细胞游离dna(cfdna)存在于活体中循环的血液中,其中可能有循环肿瘤dna(ctdna)从肿瘤细胞中流出。即使通过液体活检检测到ctdna的存在,为了准确诊断癌症,也需要额外确认ctdna来源的组织,在此过程中,癌症的诊断会延迟。然而,如果在检测相应的ctdna的同时可以识别出癌症来源的组织,则癌症的早期诊断是可能的,并且越来越需要一种识别生物样本来源的方法以早期诊断其他疾病以及癌症。
4.本发明人研究了一种基于dna甲基化数据来确定来源不明的组织和细胞的来源的方法,结果确认了对于肝癌组织具有特异性高甲基化水平的标记物,从而完成了本发明。


技术实现要素:

5.技术问题
6.本发明的一个目的是提供一种用于确定来源不明的生物样本是否源自肝癌组织的方法、一种用于确认生物样本中源自肝癌组织的dna的方法,以及一种用于实施这些方法的组合物。
7.技术方案
8.为了实现上述目的,本发明的一个方面提供了一种确定生物样本是否源自肝癌组织的方法,包括以下步骤:
9.(a)从分离自受试者的生物样本中分离dna;和
10.(b)测量分离的dna中由seq id no:1所示的序列的cpg位点的甲基化水平。
11.在本发明的一种具体实施方式中,步骤(b)可以进一步测量分离的dna中由seq id no:2所示的序列的cpg位点的甲基化水平。例如,本发明的用于确定生物样本是否源自肝癌组织的方法可以单独测量由seq id no:1所示的序列的cpg位点的甲基化水平,或步骤(b)中的seq id no:1和2所示的序列的cpg位点的甲基化水平。
12.在本发明的一种具体实施方式中,所述受试者可以是人,所述生物样本包括从所述受试者分离的组织、组织碎片、细胞、细胞碎片、血液、血浆、体液、粪便和尿液等,但不限
于此。组织、组织碎片、细胞和细胞碎片等可以从采集自受试者的血液、血浆、体液、尿液等中分离出来。另外,dna可以是从组织、细胞等中分离的dna,也可以是漂浮在血液、血浆、体液等中的细胞游离dna(cfdna)或从肿瘤细胞中流出的循环肿瘤dna(ctdna)。
13.本说明书中使用的术语“甲基化”是指甲基(-ch3)与构成dna的碱基的结合,优选是指在特定dna的特定cpg位点的胞嘧啶上发生的甲基化。
14.本说明书中使用的术语“甲基化水平”是指定量评价特定dna序列中存在的cpg位点的甲基化状态,甲基化状态是指dna序列中的一个或多个cpg位点是否存在5-甲基-胞嘧啶。
15.本说明书中使用的术语“cpg位点”是指胞嘧啶(c)和鸟嘌呤(g)通过磷酸基团连接的序列,它可以存在于包含启动子区、蛋白质编码区(开放阅读框,orf)和终止区等的dna序列中。已知cpg位点的甲基化涉及维持基因组稳定性和调节基因表达等。
16.本发明人试图发现肝癌组织特异性甲基化标记物,结果发现了在肝癌组织样本中具有高甲基化水平以及在包括正常肝脏组织和血液在内的其他组织中具有低甲基化水平的cg13204512(seq id no:1)和cg00108164(seq id no:2)标记物。两种标记物的目标甲基化位点是分别位于由seq id no:1和seq id no:2所示的序列中的第61位核苷酸的cpg位点。然而,由于甲基化甚至可能发生在除目标甲基化位点之外的其他cpg位点中,因此在本发明中,可以测量包含目标cpg位点的由seq id no:1和2所示的序列中存在的总cpg位点的甲基化水平。
17.本说明书中使用的术语“肝癌组织特异性甲基化标记物”是指与从正常肝脏组织和其他组织中分离的dna的甲基化水平相比,仅在肝癌组织的dna中显示出特定甲基化水平的甲基化标记物。在本发明中,“肝癌组织特异性甲基化标记物”是指与从正常肝脏组织及其他组织中分离的dna的甲基化水平相比,仅在肝癌组织的dna中具有高甲基化水平的标记物。
18.在本发明的一种具体实施方式中,(b)可以通过选自由pcr、甲基化特异性pcr、实时甲基化特异性pcr、methylight pcr、mehtylight数字化pcr、epityper、使用甲基化dna特异性结合蛋白的pcr、定量pcr、dna芯片、分子信标、ms-hrm(甲基化敏感性高分辨率熔解)、不对称pcr、不对称pcr ms-hrma(不对称pcr甲基化敏感性高分辨率熔解分析)、重组酶聚合酶扩增、lamp(环介导的等温扩增)、eclipse探针、下一代测序面板(ngs面板)、焦磷酸测序和二硫化物测序组成的组中的方法实施。
19.例如,甲基化水平可以通过微阵列来识别,并且微阵列可以使用固定在固体表面上的探针。探针可包含与包含cpg位点的10至100个连续核苷酸序列互补的序列。
20.在本发明的一种具体实施方式中,该方法在(b)之后,还可以包括(c)将甲基化水平与对照组的甲基化水平进行比较。
21.在本发明中,对照组是指从已知其来源于哪种组织的生物样本中分离的dna,可以使用包括正常肝脏组织和肝癌组织在内的活体内的所有组织。例如,在以肝癌组织为对照组的情况下,当从生物样本中分离的dna的甲基化水平与从对照组分离的dna的甲基化水平相似时,可以确定生物样本源自肝癌组织,而在以正常肝脏组织或其他组织为对照组的情况下,当生物样本的甲基化水平高于对照组的甲基化水平时,可以确定生物样本源自肝癌组织。
22.本发明的另一方面提供了一种用于确定生物样本是否源自肝癌组织的组合物,其包含能够测量由seq id no:1所示的序列的甲基化水平的试剂。
23.在本发明的一种具体实施方式中,cpg位点可以是1个至多个,包括位于由seq id no:1和seq id no:2所示的序列中的第61位核苷酸的cpg位点。
24.在本发明中,所述组合物还可包含能够检测由seq id no:2所示的序列的甲基化水平的试剂。能够测量甲基化水平的试剂可以是与由seq id no:1和seq id no:2所示的序列的cpg位点结合的引物、探针或反义核酸,并且引物、探针或反义核酸可以用作可杂交阵列元件并且可以固定在基底上。
25.基底是合适的固体或半固体支持物,例如,它可以包括薄膜、过滤器、芯片、载玻片、晶片、纤维、磁珠或非磁珠、凝胶、管材、板、聚合物、微粒和毛细管。可杂交阵列元件可以通过化学结合方法、共价结合方法如uv或连接剂(例如:乙二醇低聚物和二胺)固定在基底上。
26.在本发明的一种具体实施方式中,从生物样本中分离的dna(样本dna)应用于可杂交阵列时可以与阵列元件进行杂交,并且根据本领域已知的技术对杂交条件可进行各种修改,对杂交水平的检测和分析可以各种方式进行。此外,为了提供允许确认杂交的信号,样本dna和/或引物、探针或反义核酸可以被标记,并与寡核苷酸连接。
27.标记可包含荧光团(例如,荧光素、藻红蛋白、罗丹明、丽丝胺、cy3和cy5(pharmacia))、生色团、化学发光团、磁性粒子、放射性同位素(p32和s35)、酶(碱性磷酸酶或辣根过氧化物酶)、辅因子、酶的底物、重金属(例如金)、抗体、链霉亲和素、生物素、地高辛和具有特定结合配偶体(例如螯合基团)的半抗原,但不限于此。
28.在本发明中,引物、探针或反义核酸与样本dna的杂交取决于多种因素,例如反应温度、杂交和洗涤时间、缓冲液组分及其ph和离子强度、核苷酸长度、核苷酸序列、gc序列的数量等。杂交的详细条件可参考joseph sambrook等人,分子克隆(molecularcloning),实验室手册(alaboratorymanual),cold spring harbor laboratory press,cold spring harbor,n.y.(2001);和m.l.m.anderson,核酸杂交(nucleicacid hybridization),springer-verlag new york inc.n.y.(1999)。
29.在杂交反应之后,可以检测通过杂交反应产生的杂交信号。例如,当探针被酶标记时,可以通过使酶的底物与杂交反应产物反应来确认杂交。
30.作为酶和底物,可以使用过氧化物酶(例如辣根过氧化物酶)和氯萘酚、氨基乙基咔唑、二氨基联苯胺、d-荧光素、光泽精(双-n-甲基吖啶硝酸盐)、试卤灵苄醚、鲁米诺、amplex red试剂(10-乙酰-3、7-二羟基吩恶嗪)、hyr(对苯二胺-hcl和邻苯二酚)、tmb(四甲基联苯胺)、abts(2、2'-氮杂二[3-乙基苯并噻唑啉磺酸盐])、邻苯二胺(opd)和萘酚/焦宁;碱性磷酸酶和溴氯吲哚磷酸盐(bcip)、氯化硝基四氮唑蓝(nbt)、萘酚-as-b1-磷酸盐和ecf底物;葡萄糖氧化酶和t-nbt(氯化硝基四氮唑蓝)和m-pms(吩嗪硫酸甲酯)。
[0031]
本发明的另一方面提供一种用于诊断肝癌的组合物,其包含能够测量由seq id no:1所示的序列的甲基化水平的试剂。
[0032]
在本发明中,用于诊断肝癌的组合物可以进一步包含能够测量由seq idno:2所示的序列的甲基化水平的试剂,并且能够测量甲基化水平的试剂包括与由seq id no:1和seq id no:2组成的序列的cpg位点结合的引物、探针或反义核酸。seq id no:1或2所示的
序列可以是基因组dna,也可以是通过亚硫酸氢盐处理将非甲基化胞嘧啶转化为尿嘧啶的序列。
[0033]
在本发明中,当从分离自受试者的生物样本中分离dna后,测量肝癌组织特异性标记物的甲基化水平时,可以检测源自肝癌组织的dna。作为结果,可以通过确认源自肝癌组织的dna的存在来诊断肝癌,并且本发明的用于诊断肝癌的组合物的特征在于,可以使用各种来源的生物样本来诊断肝癌。
[0034]
在本发明中,生物样本包括从受试者中分离出的组织、组织碎片、细胞、细胞碎片、血液、血浆、体液、粪便和尿液等,但不限于此。
[0035]
有益效果
[0036]
用于确定生物样本是否来自肝癌组织的方法和实施该方法的组合物使用肝癌组织特异性dna甲基化标记物,并且该肝癌组织特异性标记物在正常肝脏组织和其他组织中具有低甲基化水平,且仅在肝癌组织中具有高甲基化水平,因此可以非常准确地确定生物样本是否来自肝脏组织。
[0037]
附图的简要说明
[0038]
图1示意性地示出了发现肝癌组织特异性标记物的过程。
[0039]
图2示出了发现的肝癌组织特异性标记物的可变重要性图(varimp图)。
[0040]
图3示出了最终选择的cg13204512和cg00108164标记物性能的确认结果。
[0041]
图4示出了最终选择的cg13204512和cg00108164标记物在正常肝脏组织(lihc_n)、肝癌组织(lihc_t)和除肝脏以外的泛肿瘤组织(pan_t)中的甲基化水平的确认结果。
[0042]
图5示出了在各种正常组织(a)和癌组织(b)中cg13204512标记物的甲基化水平的确认结果。
[0043]
图6示出了在各种正常组织(a)和癌组织(b)中cg00108164标记物的甲基化水平的确认结果。
[0044]
图7示出了在主要正常组织和癌组织中cg13204512和cg00108164标记物的甲基化水平的确认结果:膀胱(bl)、乳房(br)、宫颈(ce)、结肠(co)、食道(es)、胶质母细胞瘤(gb)、头颈部(hn)、肾脏(ki)、肝脏(li)、肺(lu)、胰腺(pa)、副神经节瘤(pc)、前列腺(pr)、直肠(re)、肉瘤(sa)、皮肤(sk)、胃(st)、胸腺(th)、子宫(uc)和血液(b)。
具体实施方式
[0045]
在下文中,将通过一个或多个具体示例更详细地描述本发明。然而,这些实施例旨在说明一个或多个具体实施例,但本发明的范围不受这些实施例的限制。
[0046]
实施例1:肝癌组织特异性甲基化标记物的发现
[0047]
各种癌的dna甲基化数据从the cancer genome atlas(以下简称tcga)下载。从tcga下载的数据中,甲基化cpg位点选自肝癌组织样本(n=379),而非甲基化cpg位点另外选自其他组织的癌样本(n=7260)。标准是在50%或更多的样本被甲基化的情况下分类为甲基化,并且在90%或更多的样本未被甲基化的情况下分类为未甲基化。
[0048]
然后,进一步选择除肝癌以外的90%的癌样本(泛肿瘤)中的非甲基化cpg位点,以及正常肝组织和肝癌组织中30%或更多的不同甲基化水平的cpg位点。
[0049]
在图1中,示意性地示出了发现本发明的肝癌组织特异性标记物的过程。
[0050]
实施例2:肝癌组织特异性甲基化标记物的性能的验证
[0051]
上述实施例1中发现的肝癌组织特异性标记物的可变重要性图(varimp图)是通过随机森林法制作的,如图2所示。在图2中,x轴的准确度平均减少量(meandecreaseaccuracy)表示各标记物有助于提高肝癌组织/正常肝脏组织的分类准确度的程度,y轴的基尼指数平均减少量(meandecreasegini)表示各标记物有助于改善肝癌组织/正常肝脏组织和其他组织分类中不纯度的程度。换言之,较大的值意味着该标记物可以清楚地区分肝癌组织与正常肝脏组织和其他组织。
[0052]
然后,通过将实施例1中使用的癌组织的甲基化数据随机分为训练数据和验证数据来测试肝癌组织特异性标记物。结果,如下表1所示,可以确认发现的标记物以高效率和准确度区分肝脏组织和其他组织。肝脏组织特异性标记物的性能显示其准确度为0.9915、灵敏度为0.8816、特异性为0.9973和曲线下面积(auc)为0.9668。
[0053]
表1
[0054][0055]
然后,进一步验证了图1的可变重要性图中具有高重要性的两种标记物(cg13204512、cg00108164)的性能。结果,如图2所示,两种标记物的曲线下面积(auc)为0.9725,证实了区分肝癌组织和其他组织的性能良好。
[0056]
基于以上结果,最终选择cg13204512和cg00108164标记物作为肝癌组织特异性标记物。在下表2和表3中,描述了cg13204512和cg00108164标记物的信息和序列。
[0057]
表2
[0058][0059]
表3
[0060][0061]-在表中,[cg]是指每个探针的目标甲基化位点。
[0062]
实施例3:最终选择的肝癌组织特异性标记物的验证
[0063]
确定最终选择的cg13204512和cg00108164标记物在肝癌组织、正常肝脏组织和其他组织中的甲基化水平。结果,如图4的a和b所示,可以看出,这两种标记物在正常肝脏组织(lihc_n)和除肝脏外的泛肿瘤组织(pan_t)中具有低甲基化水平,而在肝癌组织(lihc_t)的肝癌组织中具有高甲基化水平。
[0064]
在图5至图7中,示出了在肝脏组织和其他组织中确认的cg13204512和cg00108164标记物的甲基化水平。
[0065]
从目前的结果可以看出,cg13204512和cg00108164标记物在肝癌组织中具有高甲基化水平,而在正常肝脏组织和其他组织中具有低甲基化水平,因此这两种标记物可以作为肝癌组织特异性标记物。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1