本发明涉及医学诊断,具体涉及一种基于代谢组学的乳腺癌代谢物数据处理方法。
背景技术:
1、乳腺癌(breast cancer,bc)已超过肺癌成为发病率最高的恶性肿瘤,同时也是全球女性癌症相关死亡的主要原因。中国是乳腺癌发病和死亡人数最多的国家,根据中国国家癌症中心的最新数据,2016年中国新发乳腺癌患者占女性所有癌症新发病例的16.72%(30.6万)。此外,中国的乳腺癌呈年轻化发病趋势,确诊时的平均年龄为45-55岁,比西方女性提前约10年。乳腺癌患者的预后与其确诊时疾病所处的阶段密切相关。具体而言,i期患者的5年生存率接近100%,而iv期患者的5年生存率仅为20%左右。随着人口老龄化、工业化、城市化进程的加快和生活方式的改变,中国女性乳腺癌的发病率和死亡率逐年上升,给社会和经济带来沉重负担。迄今为止,bc的病因仍然不明,也没有针对bc的一级预防策略。因此,提高早期乳腺癌的早期检出率并进行及时有效的治疗是提高乳腺癌患者5年生存率的关键,能大大降低乳腺癌患者的死亡率。
2、乳腺癌相关的筛查与诊断指南推荐使用乳腺钼靶、乳腺超声和乳腺mri进行乳腺癌筛查和诊断,但这些方法的灵敏度普遍不高,且可能存在辐射暴露和检查引起的相关疼痛。除此之外,临床上常用于乳腺癌筛查的无创肿瘤标志物有:癌胚抗原(cea)、糖类抗原15-3(ca15-3)等。然而,ca15-3和cea在早期bc患者中的阳性率较低,敏感性较差。因此,积极探索用于筛查和诊断bc的敏感、特异和无创生物标记物显得尤为迫切和重要。代谢组学研究作为后基因组时代系统生物学领域中重要的技术手段,已经成为研究包括癌症在内的多种疾病研究的有力工具。代谢组学可以反应机体代谢状态的动态变化,并提供有临床价值的代谢改变信息,从而可为对乳腺癌的病理提供新的见解。目前,已有较多针对乳腺癌的代谢组学研究,但这些研究的结果存在一定的争议。例如,zhou等人的研究表明,与健康对照组相比,乳腺癌患者血清中谷氨酸的水平下降;与健康对照组相比,乳腺癌患者血清中谷氨酸的水平下降,而wang等人观察到谷氨酸的水平上升。此外,有两项研究发现一些氨基酸的水平,如缬氨酸和酪氨酸,在乳腺癌患者的血液中低于健康对照组。而另一项研究报告的结果则相反。因此,采用大规模临床样本进行代谢组学分析,寻找灵敏度高、特异性号且经济安全的乳腺癌血清代谢标志物,并对其所属数据的处理分类亟需一种高效合理的方法。
技术实现思路
1、针对现有技术的不足,本发明提供了一种基于代谢组学的乳腺癌代谢物数据处理方法,通过谷氨酸、二十二碳六烯酸、赤酮酸、丙酰肉碱和年龄建立新的代谢物组合模型获取患病风险预测结果。
2、为实现上述目的,本发明提供了一种基于代谢组学的乳腺癌代谢物数据处理方法,包括:
3、获取乳腺癌筛查对应代谢物基础数据;
4、利用所述代谢物基础数据建立乳腺癌筛查血清代谢物组合模型;
5、根据所述乳腺癌筛查血清代谢物组合模型得到乳腺癌代谢物数据处理结果。
6、优选的,所述获取乳腺癌筛查对应代谢物基础数据包括:
7、获取乳腺癌筛查对应病患自身数据;
8、获取乳腺癌筛查对应代谢物数据;
9、利用所述病患自身数据与代谢物数据作为代谢物基础数据;
10、其中,所述病患自身数据为病患年龄。
11、进一步的,所述获取乳腺癌筛查对应代谢物数据包括:
12、基于质谱检测分别获取谷氨酸、二十二碳六烯酸、赤酮酸与丙酰肉碱的质荷比数值;
13、利用所述谷氨酸、二十二碳六烯酸、赤酮酸与丙酰肉碱的质荷比数值作为代谢物数据。
14、进一步的,利用所述代谢物基础数据建立乳腺癌筛查血清代谢物组合模型包括:
15、利用所述代谢物基础数据中代谢物数据获取对应血清代谢物含量;
16、利用所述血清代谢物含量与病患自身数据基于代谢组学建立乳腺癌筛查血清代谢物组合模型。
17、进一步的,利用所述代谢物基础数据中代谢物数据获取对应血清代谢物含量包括:
18、获取代谢物基础数据中代谢物数据的谷氨酸对应血清谷氨酸含量;
19、获取代谢物基础数据中代谢物数据的二十二碳六烯酸对应血清二十二碳六烯酸含量;
20、获取代谢物基础数据中代谢物数据的赤酮酸对应血清赤酮酸含量;
21、获取代谢物基础数据中代谢物数据的丙酰肉碱对应血清丙酰肉碱含量;
22、利用所述血清谷氨酸含量、血清二十二碳六烯酸含量、血清赤酮酸含量与血清丙酰肉碱含量作为血清代谢物含量。
23、进一步的,根据所述乳腺癌筛查血清代谢物组合模型得到乳腺癌代谢物数据处理结果包括:
24、利用所述乳腺癌筛查血清代谢物组合模型建立乳腺癌筛查预测二元回归方程;
25、根据所述乳腺癌筛查预测二元回归方程得到乳腺癌筛查判别变量;
26、利用所述乳腺癌筛查判别变量得到乳腺癌代谢物数据处理结果。
27、进一步的,利用所述乳腺癌筛查血清代谢物组合模型建立乳腺癌筛查预测二元回归方程的计算式如下:
28、
29、其中,p为乳腺癌代谢物数据的判别变量,e为常量,glutamate为血清谷氨酸含量,erythronate为血清赤酮酸含量,dha为血清二十二碳六烯酸含量,propionylcarnitine为血清丙酰肉碱含量,age为病患年龄。
30、进一步的,利用所述乳腺癌筛查判别变量得到乳腺癌代谢物数据处理结果包括:
31、当所述乳腺癌筛查判别变量大于最佳截断值时,所述乳腺癌代谢物数据处理结果对应高风险数据,并输出对应代谢物基础数据作为乳腺癌代谢物数据处理结果;
32、当所述乳腺癌筛查判别变量不大于最佳截断值时,所述乳腺癌代谢物数据处理结果对应低风险数据,并输出对应代谢物基础数据作为乳腺癌代谢物数据处理结果;
33、其中,所述最佳截断值为0.768。
34、与最接近的现有技术相比,本发明具有的有益效果:
35、前期由血清中谷氨酸、二十二碳六烯酸、赤酮酸和丙酰肉碱构成的代谢物组合模型,通过其确定的判断变量p,具有辅助乳腺癌诊断的用途,所建立的代谢物组合模型具有通量高、灵敏度高和对个体损伤性小的特点,适用于乳腺癌的早期筛查和对常规乳腺癌肿瘤标志物及其他筛查手段的辅助应用。
1.一种基于代谢组学的乳腺癌代谢物数据处理方法,其特征在于,包括:
2.如权利要求1所述的一种基于代谢组学的乳腺癌代谢物数据处理方法,其特征在于,所述获取乳腺癌筛查对应代谢物基础数据包括:
3.如权利要求2所述的一种基于代谢组学的乳腺癌代谢物数据处理方法,其特征在于,所述获取乳腺癌筛查对应代谢物数据包括:
4.如权利要求2所述的一种基于代谢组学的乳腺癌代谢物数据处理方法,其特征在于,利用所述代谢物基础数据建立乳腺癌筛查血清代谢物组合模型包括:
5.如权利要求4所述的一种基于代谢组学的乳腺癌代谢物数据处理方法,其特征在于,利用所述代谢物基础数据中代谢物数据获取对应血清代谢物含量包括:
6.如权利要求5所述的一种基于代谢组学的乳腺癌代谢物数据处理方法,其特征在于,根据所述乳腺癌筛查血清代谢物组合模型得到乳腺癌代谢物数据处理结果包括:
7.如权利要求6所述的一种基于代谢组学的乳腺癌代谢物数据处理方法,其特征在于,利用所述乳腺癌筛查血清代谢物组合模型建立乳腺癌筛查预测二元回归方程的计算式如下:
8.如权利要求7所述的一种基于代谢组学的乳腺癌代谢物数据处理方法,其特征在于,利用所述乳腺癌筛查判别变量得到乳腺癌代谢物数据处理结果包括: