一种乳腺癌诊断标志物及其筛选方法、定量方法、诊断模型的构建方法及应用

文档序号:33764816发布日期:2023-04-18 19:13阅读:108来源:国知局
一种乳腺癌诊断标志物及其筛选方法、定量方法、诊断模型的构建方法及应用

本发明属于临床检验诊断,具体涉及一种基于代谢组学和人工智能分析方法筛选鉴定的乳腺癌诊断的诊断标志物、所述诊断标志物在乳腺癌诊断产品制备中的应用、所述诊断标志物的筛选方法、应用所述诊断标志物构建诊断模型的方法。


背景技术:

1、乳腺癌(breast cancer)是乳腺导管上皮及末梢导管上皮发生的恶性肿瘤,近几年来发病率有明显的上升趋势,在临床上属于女性常见病。根据世界卫生组织国际癌症研究机构(iarc)发布的2020年全球最新癌症负担数据,全球乳腺癌新发病例高达226万例,超过了肺癌的220万例,乳腺癌取代肺癌,成为全球第一大癌。2020年中国癌症新发病例中乳腺癌发病率位居第四位,在2020年中国癌症死亡率中位居第七位。

2、根据国家癌症中心发布的2022年全国癌症报告,近年来中国乳腺癌发病率与死亡率仍呈逐年递增趋势。乳腺癌发病人数增加,根本原因之一是乳腺癌风险因素的不断变化,比如推迟生育、生育次数减少,超重和肥胖,以及缺乏运动等。

3、乳腺癌的确切发病机制尚不明确,相关高危因素难以控制,一级病因预防较难实现,故目前乳腺癌的防控以“早发现、早诊断、早治疗”的二级预防为主。乳腺癌的早期筛查主要依靠于临床影像学检查,但由于医疗资源分配不均、防癌意识相对薄弱、筛查覆盖人群有限以及临床医师水平参差不齐等原因,导致我国早期乳腺癌整体诊断率略显偏低。

4、早期乳腺癌术后10年生存率可达90%以上,大大高于中晚期乳腺癌患者。所以,乳腺癌的早期发现至关重要,发现得越早,治愈可能性就越大。然而,早期乳腺癌往往不具备典型的症状和体征,大多为无痛性肿块、乳头溢液,少数伴有隐痛或刺痛。目前使用最广泛的乳腺癌筛查方法是乳腺钼靶x线检查,但因早期乳腺癌肿瘤范围较小且腺体密度较高,使肿瘤图像模糊,导致钼靶x线检查难度较大且误诊率和漏诊率较高。肿瘤标记物包括癌胚抗原(cea)、癌抗原(ca15-3)等的灵敏度和特异度均难以达到临床诊断标准,且容易受到患者的既往病史和不良嗜好影响。因此开发出一种简单便捷并具有高特异度和高敏感度的新型乳腺癌诊断产品将极大促进乳腺癌的早诊早治、提升疗效和患者的预后,具有重大的临床意义和社会经济意义。


技术实现思路

1、本发明的目的在于提供一种乳腺癌诊断标志物及其筛选方法、定量方法、诊断模型的构建方法及应用。本发明所述诊断标志物对于乳腺癌具有较好的灵敏性和特异性,可用于乳腺癌诊断(包括乳腺癌的早期诊断),对于改善乳腺癌的预后、提高乳腺癌患者的生存率具有重要意义。

2、本发明提供了一种乳腺癌诊断标志物,所述诊断标志物包括以下24种血浆代谢标志物中的任意一种或两种以上:哌啶、肌苷、亮氨酸、尿苷、苯丙氨酸、苏氨酸、n-乙酰-dl-天冬氨酸、n-乙酰-dl-谷氨酸、葡萄糖酸、n-乙酰甘氨酸、对氯苯酚、脯氨酸、缬氨酸、左旋肉碱、l-乙酰基肉碱、精氨酸、赖氨酸、酪氨酸、3-甲基黄嘌呤、吲哚-3-乙醛、3-羟基丁酸、顺乌头酸、2-羟基苯乙酸和磷酸胆碱。

3、优选的是,所述诊断标志物包括以下6种血浆代谢标志物中的任意一种或两种以上:哌啶、肌苷、亮氨酸、尿苷、苯丙氨酸和苏氨酸。

4、优选的是,所述诊断标志物包括以下1种血浆代谢标志物:哌啶。

5、本发明还提供了检测上述技术方案所述诊断标志物的试剂在制备乳腺癌诊断产品中的应用,所述产品包括试剂盒。

6、本发明还提供了一种乳腺癌诊断试剂盒,包括检测上述技术方案所述诊断标志物的试剂。

7、本发明还提供了上述技术方案所述诊断标志物的筛选方法,包括以下步骤:

8、1)使用机器学习支持向量机算法学习经过非靶向代谢组学分析、检索及数据预处理后的二维矩阵数据,随机将乳腺癌及健康对照血浆样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代2000次,通过统计最终支持向量机模型准确度的平均值,确定该支持向量机模型可有效对乳腺癌患者与健康人群的代谢组数据进行分类;

9、2)根据上述得到的支持向量机模型,通过基于机器学习的特征筛序,借助支持向量机建模的特征重要性评分并不断累加重要特征形成待测模型,评估模型分类准确度以显示不同模型的分类效能,并最终展示相对最优特征数及组合方式;所述筛选最优特征数及组合方式的标准为:增加特征数时模型准确度不再上升;

10、3)将上述筛选得到的最优特征即目标差异代谢物进行基于质谱的优化筛选,使用ms-dial软件根据色谱峰型及二级质谱图数据质量筛选并获得潜在代谢标志物;

11、4)根据上述潜在代谢标志物的一级和二级质谱信息,推测标志物的分子质量和分子式,并且与代谢物谱图数据库中的谱图信息进行比对,从而对代谢物进行鉴定,得到适合于乳腺癌诊断的血浆代谢标志物。

12、本发明还提供了一种基于上述技术方案所述诊断标志物的乳腺癌诊断模型的构建方法,包括以下步骤:

13、1)将乳腺癌患者和健康人群的血浆样本作为分析样本;

14、2)使用液相色谱质谱联用仪对每个分析样本进行诊断标志物的靶向代谢组学分析,得到各血浆样本的靶向代谢组图谱;

15、3)使用multiquant软件对乳腺癌患者血浆样本和健康人群血浆样本的靶向代谢组图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的标志物二维矩阵,用于进一步的机器学习;

16、4)根据所述诊断标志物的二维矩阵,使用机器学习支持向量机构建分类模型,得到乳腺癌诊断模型。

17、本发明还提供了上述技术方案所述构建方法构建得到的乳腺癌诊断模型。

18、本发明还提供了一种基于上述技术方案所述诊断标志物的靶向代谢组学绝对定量方法,包括以下步骤:

19、1)标准品准备

20、(a)制备各诊断标志物的标准储备溶液和同位素内标储备溶液;

21、(b)准备相应浓度梯度的混合标准品:标准工作校准溶液在合并的标准储备溶液连续稀释后获得,稀释比例为1~1/90;

22、(c)准备标准品质控品:使用合并的标准储备溶液准备稀释比为3/4、5/12、1/12的标准品质控品,分别定义为高浓度质控品、中浓度质控品、低浓度质控品;

23、2)样本制备

24、(a)配制含有同位素内标的萃取液:将步骤1)获得的同位素内标储备溶液与预冷的甲醇震荡混匀;

25、(b)萃取样本:将分析样本、标准工作校准样本或标准品质控品与步骤(a)制备得到的萃取液混合,震荡,离心,取上清,在真空浓缩仪中蒸干,得到干粉;

26、(c)复溶样本:将干粉用乙腈水复溶液复溶后离心,将上清液转移入lc-ms进样瓶中;

27、3)lc-ms/ms分析:使用液相色谱质谱联用仪对每个分析样本、标准工作校准样本或标准品质控品进行诊断标志物的靶向代谢组学分析,得到各样本的靶向代谢组图谱;

28、4)数据分析:使用multiquant软件对靶向代谢组图谱进行图谱处理和定量分析,得到每行为代谢物信息、每列为分析样本的标志物二维矩阵;标准曲线采用内标法,通过标准品的峰面积与其对应的同位素内标面积比进行绘制,拟合后获得线性方程和相关系数r2,计算得到相应代谢物的定量浓度。

29、优选的是,当所述诊断标志物为哌啶、肌苷、亮氨酸、尿苷、苯丙氨酸和苏氨酸时,所述绝对定量方法包括以下步骤:

30、1)标准品准备

31、(a)制备标准储备溶液和同位素内标储备溶液:将标准品哌啶、肌苷、尿苷及其相应的同位素内标包括哌啶-d11、肌苷-13c5、尿苷-13c5分别溶解于甲醇中,将标准品亮氨酸、苯丙氨酸、苏氨酸及其相应的同位素内标包括亮氨酸-d3、苯丙氨酸-d8、苏氨酸-15n分别溶解于甲醇水溶液中,以上浓度均为1mg/ml;所述甲醇水溶液中甲醇和水的体积比为1:1;

32、(b)准备相应浓度梯度的混合标准品:标准工作校准溶液在合并的标准储备溶液连续稀释后获得,稀释比例分别为1,5/6,2/3,5/9,4/9,1/3,2/9,1/9,1/18,2/45,1/30,1/45和1/90;

33、(c)准备标准品质控品:使用合并的标准储备溶液准备稀释比为3/4、5/12、1/12的标准品质控品,分别定义为高浓度质控品、中浓度质控品、低浓度质控品;

34、2)样本制备

35、(a)配制含有同位素内标的萃取液:将步骤1)获得的6种同位素内标储备溶液与-20℃预冷2h以上的甲醇混合并震荡混匀,使哌啶-d11在甲醇中的质量浓度为25ng/ml,肌苷-13c5在甲醇中的质量浓度为5ng/ml,尿苷-13c5在甲醇中的质量浓度为250ng/ml,亮氨酸-d3、苯丙氨酸-d8和苏氨酸-15n在甲醇中的质量浓度均为500ng/ml;

36、(b)萃取样本:将分析样本、标准工作校准样本或标准品质控品与步骤(a)制备得到的萃取液按照体积比为1:4混合,震荡30min,4℃,12000rpm离心20min,吸取上清,在真空浓缩仪中蒸干,得到干粉;

37、(c)复溶样本:将干粉用乙腈水复溶液复溶后,在高速离心机中于4℃下以12000rpm离心20min,将上清液转移入lc-ms进样瓶中;所述乙腈水复溶液中乙腈和水的体积比为1:1;

38、3)lc-ms/ms分析:使用液相色谱质谱联用仪对每个分析样本、标准工作校准样本或标准品质控品进行诊断标志物的靶向代谢组学分析,得到各样本的靶向代谢组图谱;

39、4)数据分析:使用multiquant软件对靶向代谢组图谱进行图谱处理和定量分析,得到每行为代谢物信息、每列为分析样本的标志物二维矩阵;标准曲线采用内标法,通过标准品的峰面积与其对应的同位素内标面积比进行绘制,拟合后获得线性方程和相关系数r2,计算得到相应代谢物的定量浓度。

40、本发明提供了一种乳腺癌诊断标志物。本发明采用血浆代谢组学方法以及人工智能数据分析方法得到适合于乳腺癌诊断的诊断标志物。本发明所述诊断标志物对于乳腺癌具有较好的灵敏性和特异性,可用于乳腺癌诊断(包括乳腺癌的早期诊断),对于改善乳腺癌的预后、提高乳腺癌患者的生存率具有重要意义。

41、本发明诊断标志物筛选方法可操作性强,模型构建方法简单,所得诊断模型效果良好,灵敏度高,特异性好,适合于乳腺癌的诊断,尤其对于乳腺癌早期诊断也具有较高的灵敏度和特异性。本发明仅通过取血检测就能实现诊断,无需影像学医疗设备,不会对人体造成任何辐射,可提高患者早期筛查的采样效率,有利于大规模筛查的普及推广,能够很好地替代乳腺钼靶x线检查的早期筛查模式,并且本发明诊断简单快速,有利于乳腺癌的早诊早治,具有很好的临床使用和推广价值。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1