基于新型血液标志物cfDNA的肝癌预测模型及其构建方法与流程

文档序号:33174200发布日期:2023-02-04 03:12阅读:43来源:国知局
基于新型血液标志物cfDNA的肝癌预测模型及其构建方法与流程
基于新型血液标志物cfdna的肝癌预测模型及其构建方法
技术领域
1.本发明涉及生物学研究及生物信息学研究技术领域,具体涉及基于新型血液标志物cfdna的肝癌预测模型及其构建方法。


背景技术:

2.肝癌是我国乃至世界范围内最常见的实体恶性肿瘤之一,目前针对肝癌的治疗手段主要包括手术切除、肝移植、射频消融、经肝动脉化疗栓塞术等,肝癌患者的生存期延长,生存质量得到一定改善。然而,由于肝癌起病及进展隐匿,发现时往往己失去手术机会,且复发及转移率仍居高不下,总体预后仍较差。因此,迫切需要寻找新的诊断和治疗方法,尤其是早期诊断,来提高患者的生存质量。
3.目前,传统的影像学手段与血液标志物对于微小残余病灶的检测能力十分有限,难以解决临床上继续面对的预后评估问题。近年来得到高速发展的液态活检技术能够对患者的肿瘤负荷进行动态评估,具有较高的灵敏性,为肿瘤术后微小残余病灶的检测提供了新的工具与策略。
4.既往针对恶性肿瘤的诊断主要是依靠病理的形态学观察和临床的影像学检测,即依据肿瘤的形态学来诊断,而随着各项生物技术的进步,如基因检测、蛋白质组学等很多技术手段应用于癌症的辅助诊断,使癌症的诊断更加趋向于功能学诊断。
5.血常规、血生化、肿瘤标志物中包含了大量的人体健康信息,许多项具体指标都是一些常用的敏感指标,对机体内许多病理改变都有敏感反映,患者在病因不明时可以做血液检查对其进行辅助诊断。游离dna(circulating free dna or cell free dna,cfdna),循环游离dna或者细胞游离dna,是释放到血浆中的降解的dna片段。cfdna存在于人体的各种体液中,随组织损伤、癌症和炎症反应等发生浓度变化。目前大量的研究证实,血液检查指标、肿瘤标志物、cfdna与恶性肿瘤都存在关联性。如果能够联合多种检验结果综合分析,提高恶性肿瘤筛查的准确度,对于恶性肿瘤的筛查具有很高的实际应用价值。


技术实现要素:

6.本发明的目的在于提供基于新型血液标志物cfdna的肝癌预测模型及其构建方法,液体活检肝癌早筛产品的敏感性和特异性均超过90%,具有很高的临床价值,以解决上述背景技术中提出的问题。
7.为实现上述目的,本发明提供如下技术方案:
8.基于新型血液标志物cfdna的肝癌预测模型,该模型基于mirna在肝癌组织中下调表达,mirna是一类短小(长度约为22个核苷酸)的非编码rna分子,通过破坏mrna的稳定结构或通过抑制翻译调节基因的表达而发挥作用,所述mirna模型的检测指标为下列mirna中的一种或几种:mirna-10b-5p、mirna-10b-3p、mirna-224-5p、mirna-183-5p、mirna-182-5p;
9.所述mirna在肝癌样本中高表达,所述肝癌样本为外周血、组织(用于获取血常规
的指标以及深化指标),血浆cfdna测序可提供大小片单分布的dna片段和末端序列占比与肝癌相关联的诊断模型;
10.所述肝癌相关联的诊断模型包括内参基因检测试剂、甲基化数据、检测组合标志物中各个基因甲基化水平的引物。
11.其中,所述组合标志物的检测试剂可包括用于检测所述组合标志物中各个基因甲基化水平的引物和/或探针。
12.其中,所述内参基因检测试剂的试剂盒中包括:septin9基因甲基化检测位点对应的引物序列;septin9基因检测位点探针序列;内参基因检测位点对应引物序列;内参基因检测位点探针序列,septin9基因检测位点为septin9基因cpg岛3的一个位点;内参基因为actin。
13.其中,所述血常规指标包括白细胞计数(wbc),红细胞计数(rbc),血红蛋白(hb),红细胞比容(hct),平均红细胞体积(mcv),平均红细胞血红蛋白含量(mch),平均红细胞血红蛋白浓度(mchc),血小板计数(plt),淋巴细胞百分比(lymph%),单核细胞百分比(mono%),中性粒细胞百分比(neut%),嗜酸性粒细胞百分比(eos%),嗜碱性粒细胞百分比(baso%),淋巴细胞计数(lymph),单核细胞计数(mono),中性粒细胞计数(neut),嗜酸性粒细胞计数(eos),嗜碱性粒细胞计数(baso),红细胞体积分布宽度cv(rdw-cv),红细胞体积分布宽度sd(rdw-sd),血小板分布宽度(pdw),平均血小板体积(mpv),大血小板百分比(p-lcr%),血小板比容(pct)。
14.其中,所述血生化指标包括谷草转氨酶(ast),谷丙转氨酶(alt),谷草转氨酶/谷丙转氨酶(s/l),谷氨酰转肽酶(ggt),碱性磷酸酶(alp),总蛋白(tp),白蛋白(alb),球蛋白(glo),白蛋白/球蛋白(a/g),总胆红素(tbil),直接胆红素(dbil),间接胆红素(ibil),总胆固醇(chol),高密度脂蛋白(hdl-c),低密度脂蛋白(ldl/c),甘油三酯(tg),葡萄糖(glu),尿素氮(bun),肌酐(crea),尿素氮/肌酐(bun/crea),尿酸(uric)。
15.其中,所述组合标志物中各个基因甲基化水平的引物包括dntps、缓冲液、热启动dna聚合酶(hotstart taq)、ddh2o、特异性扩增引物siq数据列,所述siq数据列在其标记序列首端具有生物素标记。
16.其中,对用于所述cfdna甲基化水平的参考基因组数据和原始的测序样本数据进行对比处理,调用yfpga-808用于实现比对器将预处理后的测序样本数据和参考基因组进行比对。
17.本发明还提供一种基于新型血液标志物cfdna的肝癌预测模型的构建方法,包括如下步骤:
18.s1、采用变分自动编码器将已知数据库中的甲基化测序数据转换为拟真数据,肝癌诊断引物采用高通量测序方法和/或定量pcr方法和/或基于探针杂交方法检测样本中mirna和/或其前体的表达情况;
19.s2、捕获cfdna并创建相关数据库,血液检测连接反应的产物采用探针组和单条引物对其进行捕获延伸;
20.s3、将cfdna相关数据库的数据结果比对至参考基因组,获得在参考基因组上的不同窗口范围内的不同长度区间内的多段列表的数量初始特征值,设定为数据基块;
21.s4、筛选数据基块,用于筛选出初始特征值中在参照组和检测组的样本之间存在
显著性差异的特征值,作为数据基块特征向量;
22.s5、将参照组和检测组样本的数据基块特征向量输入后,以患肝癌概率作为模型输出值,获得早筛模型,并持续对模型进行训练。
23.其中,所述步骤s2中的探针组包括16个探针,分别是核苷酸序列如siq id no.5所示的探针1,核苷酸序列如siq id no.6所示的探针2,核苷酸序列如siq id no.7所示的探针3,核苷酸序列如siq id no.8所示的探针4,核苷酸序列如siq id no.9所示的探针5,核苷酸序列如siq id no.10所示的探针6,核苷酸序列如siq id no.11所示的探针7,核苷酸序列如siq id no.12所示的探针8,核苷酸序列如siq id no.13所示的探针9,核苷酸序列如siq id no.14所示的探针
10
,核苷酸序列如siq id no.15所示的探针
11
,核苷酸序列如siq id no.16所示的探针
12
,核苷酸序列如siq id no.17所示的探针
13
,核苷酸序列如siq id no.18所示的探针
14
,核苷酸序列如siq id no.19所示的探针
15
,核苷酸序列如siq id no.20所示的探针
16

24.综上所述,由于采用了上述技术,本发明的有益效果是:
25.本发明中,基于cfdna血浆测序提供了大小片单分布的dna片段和末端序列占比与肝癌关系的诊断模型,该模型不仅能够诊断早期肝癌还能够区分肝硬化,具有无创检测,通量低,检测特异性和敏感性高的优势,能够联合多种检验结果综合分析,提高恶性肿瘤筛查的准确度;
26.本发明中,通过对从甲基化引物中获取的样本数据进行预处理,再对预处理结果进行对照,最后根据检验结果从比对处理结果中筛选出肿瘤甲基化标记物,完成了基于dna甲基化芯片数据筛选肿瘤甲基化标志物,提高了肿瘤甲基化标记物筛选的可靠性与有效性,筛选方法简便可行,可广泛应用于医学计算机应用领域。
附图说明
27.图1为本发明基于新型血液标志物cfdna的肝癌预测模型的创建流程图。
具体实施方式
28.为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
29.在本发明的描述中,需要理解的是,指示方位或位置关系的术语为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
30.本发明提供了基于新型血液标志物cfdna的肝癌预测模型,该模型基于mirna在肝癌组织中下调表达,mirna是一类短小(长度约为22个核苷酸)的非编码rna分子,通过破坏
mrna的稳定结构或通过抑制翻译调节基因的表达而发挥作用,所述mirna模型的检测指标为下列mirna中的一种或几种:mirna-10b-5p、mirna-10b-3p、mirna-224-5p、mirna-183-5p、mirna-182-5p;
31.所述mirna在肝癌样本中高表达,所述肝癌样本为外周血、组织(用于获取血常规的指标以及深化指标),血浆cfdna测序可提供大小片单分布的dna片段和末端序列占比与肝癌相关联的诊断模型;
32.所述肝癌相关联的诊断模型包括内参基因检测试剂、甲基化数据、检测组合标志物中各个基因甲基化水平的引物。
33.具体的,所述组合标志物的检测试剂可包括用于检测所述组合标志物中各个基因甲基化水平的引物和/或探针。
34.具体的,所述内参基因检测试剂的试剂盒中包括:septin9基因甲基化检测位点对应的引物序列;septin9基因检测位点探针序列;内参基因检测位点对应引物序列;内参基因检测位点探针序列,septin9基因检测位点为septin9基因cpg岛3的一个位点;内参基因为actin。
35.具体的,所述血常规指标包括白细胞计数(wbc),红细胞计数(rbc),血红蛋白(hb),红细胞比容(hct),平均红细胞体积(mcv),平均红细胞血红蛋白含量(mch),平均红细胞血红蛋白浓度(mchc),血小板计数(plt),淋巴细胞百分比(lymph%),单核细胞百分比(mono%),中性粒细胞百分比(neut%),嗜酸性粒细胞百分比(eos%),嗜碱性粒细胞百分比(baso%),淋巴细胞计数(lymph),单核细胞计数(mono),中性粒细胞计数(neut),嗜酸性粒细胞计数(eos),嗜碱性粒细胞计数(baso),红细胞体积分布宽度cv(rdw-cv),红细胞体积分布宽度sd(rdw-sd),血小板分布宽度(pdw),平均血小板体积(mpv),大血小板百分比(p-lcr%),血小板比容(pct)。
36.具体的,所述血生化指标包括谷草转氨酶(ast),谷丙转氨酶(alt),谷草转氨酶/谷丙转氨酶(s/l),谷氨酰转肽酶(ggt),碱性磷酸酶(alp),总蛋白(tp),白蛋白(alb),球蛋白(glo),白蛋白/球蛋白(a/g),总胆红素(tbil),直接胆红素(dbil),间接胆红素(ibil),总胆固醇(chol),高密度脂蛋白(hdl-c),低密度脂蛋白(ldl/c),甘油三酯(tg),葡萄糖(glu),尿素氮(bun),肌酐(crea),尿素氮/肌酐(bun/crea),尿酸(uric)。
37.具体的,所述组合标志物中各个基因甲基化水平的引物包括dntps、缓冲液、热启动dna聚合酶(hotstart taq)、ddh2o、特异性扩增引物siq数据列,所述siq数据列在其标记序列首端具有生物素标记。
38.具体的,对用于所述cfdna甲基化水平的参考基因组数据和原始的测序样本数据进行对比处理,调用yfpga-808用于实现比对器将预处理后的测序样本数据和参考基因组进行比对。
39.基于cfdna血浆测序提供了大小片单分布的dna片段和末端序列占比与肝癌关系的诊断模型,该模型不仅能够诊断早期肝癌还能够区分肝硬化,具有无创检测,通量低,检测特异性和敏感性高的优势。
40.本发明还提供一种基于新型血液标志物cfdna的肝癌预测模型的构建方法,包括如下步骤:
41.s1、采用变分自动编码器将已知数据库中的甲基化测序数据转换为拟真数据,肝
癌诊断引物采用高通量测序方法和/或定量pcr方法和/或基于探针杂交方法检测样本中mirna和/或其前体的表达情况;
42.s2、捕获cfdna并创建相关数据库,血液检测连接反应的产物采用探针组和单条引物对其进行捕获延伸;
43.s3、将cfdna相关数据库的数据结果比对至参考基因组,获得在参考基因组上的不同窗口范围内的不同长度区间内的多段列表的数量初始特征值,设定为数据基块;
44.s4、筛选数据基块,用于筛选出初始特征值中在参照组和检测组的样本之间存在显著性差异的特征值,作为数据基块特征向量;
45.s5、将参照组和检测组样本的数据基块特征向量输入后,以患肝癌概率作为模型输出值,获得早筛模型,并持续对模型进行训练。
46.具体的,所述步骤s2中的探针组包括16个探针,分别是核苷酸序列如siq id no.5所示的探针1,核苷酸序列如siq id no.6所示的探针2,核苷酸序列如siq id no.7所示的探针3,核苷酸序列如siq id no.8所示的探针4,核苷酸序列如siq id no.9所示的探针5,核苷酸序列如siq id no.10所示的探针6,核苷酸序列如siq id no.11所示的探针7,核苷酸序列如siq id no.12所示的探针8,核苷酸序列如siq id no.13所示的探针9,核苷酸序列如siq id no.14所示的探针
10
,核苷酸序列如siq id no.15所示的探针
11
,核苷酸序列如siq id no.16所示的探针
12
,核苷酸序列如siq id no.17所示的探针
13
,核苷酸序列如siq id no.18所示的探针
14
,核苷酸序列如siq id no.19所示的探针
15
,核苷酸序列如siq id no.20所示的探针
16

47.综上所述,本发明通过对从甲基化引物中获取的样本数据进行预处理,再对预处理结果进行对照,最后根据检验结果从比对处理结果中筛选出肿瘤甲基化标记物,完成了基于dna甲基化芯片数据筛选肿瘤甲基化标志物,提高了肿瘤甲基化标记物筛选的可靠性与有效性,筛选方法简便可行,可广泛应用于医学计算机应用领域。
48.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
49.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1