基于拉曼光谱数据的乳腺癌分析设备、系统及存储介质的制作方法

文档序号:33987521发布日期:2023-04-29 13:54阅读:18来源:国知局
基于拉曼光谱数据的乳腺癌分析设备、系统及存储介质的制作方法

本发明涉及计算机视觉和医学图像分析领域,更具体地,涉及基于拉曼光谱数据的乳腺癌分析设备、系统、计算机可读存储介质及其应用。


背景技术:

1、乳腺癌的早期筛查可以有效降低乳腺癌的致死率。目前,乳腺癌的诊断主要依靠影像学及病理学检查等,其中用于乳腺癌筛查的影像检查主要包括超声、钼靶x线检查以及mr成像。超声成像对操作者依赖性大,操作流程非标准化,重复性欠佳,缺乏二次评估,对微小钙化灶不敏感,对微钙化、导管原位癌及体积较小的浸润性癌的敏感度差等。乳腺x线检查作为乳腺癌筛查方法,对致密型腺体的灵敏度较低,尤其当病灶靠近胸壁或与致密型腺体重叠时,易导致漏诊,假阴性较高,同时引起放射损害、过度诊断等问题,多次进行x线检查的受检者,会积累辐射量,并对受检者机体产生影响。mr成像的缺点在于特异性中等、假阳性率高、对微小钙化性病变显示不满意,检查时间长、费用昂贵。其中,影像检查中有恶性可疑的肿块必须进行穿刺活检和组织病理学检查,约70%~90%的患者在活检中确诊为良性,导致患者承受了不必要的创伤、巨大的精神压力和高额的医疗费用。因此,临床迫切需要一种客观、快速、方便、灵敏的乳腺癌早期筛查方法。

2、拉曼光谱具有无创性、无需样品制备、对样品无接触、不破坏样品结构、分析快速且操作简便和分辨率高等特点,其良好的敏感度和特异度对不同分子产生独特的谱图。因此,基于拉曼光谱进行乳腺癌早期筛查成为一种解决方法。


技术实现思路

1、本技术的目的在于,本技术实施例提供基于拉曼光谱数据的乳腺癌分析设备、系统、计算机可读存储介质及其应用,其旨在为有效解决乳腺癌早期大规模人群的筛查问题,探索将普通拉曼光谱应用于乳腺癌筛查的可行性,提供一种客观、快速、方便、灵敏的乳腺癌筛查的机器学习模型,以节省数据处理的人力和时间成本,提高实验数据的获取速度和分割统计准确度。将拉曼光谱与机器学习相结合应用数学方法分析结果,使拉曼光谱的物质识别问题转换成机器学习的分类问题,能够更加准确预测结果,提高分割效果及分割速度。拉曼光谱检测在肿瘤诊断及发生机制研究方面显示出突出优势,可以广泛应用于疾病的预测、诊断及疗效判断,是生物医学研究的强大工具。

2、根据本技术的第一方面,本技术一实施例提供了基于拉曼光谱数据的乳腺癌分析设备,所述设备包括:存储器和处理器;所述存储器用于存储程序指令;所述处理器用于调用程序指令,当程序指令被执行时,用于执行实现基于拉曼光谱数据的乳腺癌分析方法,具体步骤包括:

3、获取基于拉曼光谱检测的血清的拉曼光谱样本数据;

4、对所述拉曼光谱样本数据进行特征选择,得到光谱特征峰,所述光谱特征峰基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组筛选得到的光谱特征差异信息;

5、基于所述光谱特征峰进行分类,得到乳腺癌分类结果。

6、进一步,所述拉曼光谱样本数据是按照拉曼光谱仪操作步骤对每组每个血清样本进行有限次采集,然后对采集得到的样本数据进行均值化处理得到。

7、再进一步,所述获取基于拉曼光谱检测的血清的拉曼光谱样本数据,还包括对获取的拉曼光谱样本数据进行预处理。其中,所述预处理包括通过光谱曲线平滑与归一化、基线矫正以及光谱特征选择的方法,完成所述拉曼光谱样本数据的预处理,得到预处理后的拉曼光谱样本数据;

8、可选的,所述预处理步骤包括:

9、(1)光谱曲线平滑与归一化:使用拉曼光谱样本数据中的邻接点的平均值进行平滑拉曼光谱样本数据,将每个拉曼光谱样本数据归一化为0~1;

10、(2)基线修正:基于经光谱曲线平滑与归一化后的拉曼光谱样本数据的各特征峰对拉曼光谱样本数据进行标准化处理,重建得到基于峰值信息和相对强度构建的基线;

11、(3)光谱特征选择:基于构建的基线对拉曼光谱样本数据进行主成分分析,选取保留关键性显著信息的成分作为显著性差异特征选择结果。

12、更进一步,所述标准化处理是基于拉曼光谱样本数据的各特征峰,根据拉曼光谱样本数据噪声的标准偏差的分布通过多项式拟合法去除荧光背景,再通过滑动窗口的方法对光谱点进行分类和纠正,重建得到基于峰值信息和相对强度构建的拉曼光谱样本数据的基线。

13、进一步,所述分类通过机器学习分类模型对所述光谱特征峰所对应的具有显著性差异的乳腺癌拉曼光谱特征信息进行分类,得到乳腺癌分类结果,其中,所述机器学习分类模型通过下列方法中的任意一种或几种实现:逻辑回归、支持向量机、k最近邻、决策树、朴素贝叶斯、随机森林、主成分分析、梯度提升;可选的,所述机器学习分类模型通过多元统计方法将所述具有显著性差异的乳腺癌拉曼光谱特征信息变换到高维空间,得到乳腺癌拉曼光谱高维度信息,再对乳腺癌拉曼光谱高维度信息进行分析,得到乳腺癌分类结果。

14、再进一步,所述机器学习分类模型的构建过程包括,通过随机欠采样、smote过采样对训练数据集进行数据处理,得到分类均衡的训练数据集。

15、根据本技术的第二方面,本技术一实施例提供了基于拉曼光谱数据的乳腺癌分析系统,所述系统在执行时实现上述基于拉曼光谱数据的乳腺癌分析设备中所涉及到的基于拉曼光谱数据的乳腺癌分析方法。

16、进一步,该系统的模块化结构包括:

17、获取模块,用于获取基于拉曼光谱检测的血清的拉曼光谱样本数据;

18、特征选择模块,用于对所述拉曼光谱样本数据进行特征选择,得到光谱特征峰,所述光谱特征峰基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组筛选得到的光谱特征差异信息;

19、分类模块,基于所述光谱特征峰进行分类,得到乳腺癌分类结果。

20、再进一步,所述获取模块还包括对获取的拉曼光谱样本数据进行标准化处理,所述标准化处理是基于拉曼光谱样本数据的各光谱特征峰,根据拉曼光谱样本数据噪声的标准偏差的分布通过多项式拟合法去除荧光背景,再通过滑动窗口的方法对光谱点进行分类和纠正,重建得到基于峰值信息和相对强度构建的拉曼光谱样本数据的基线;可选的,所述光谱特征峰包括下列位置中的任意一种或几种:784 cm-1、835 cm-1、925cm-1、986cm-1、989cm-1、1002cm-1、1020cm-1、1056cm-1、1114cm-1、1127cm-1、1139cm-1、1285cm-1、1295cm-1、1346cm-1、1367cm-1、1437cm-1、1531cm-1、1650cm-1。

21、根据本技术的第三方面,本技术一实施例提供了一种计算机可读存储介质,其上存储有基于拉曼光谱数据进行乳腺癌分类分析的计算机程序,当所述计算机程序被处理器执行时,实现上述基于拉曼光谱数据的乳腺癌分析设备中所涉及的基于拉曼光谱数据的乳腺癌分析方法。

22、根据本技术的第四方面,本技术一实施例提供了其相关应用,主要包括:

23、上述的设备或系统在进行乳腺癌目标分类任务中的应用;可选的,所述目标分类任务包括对正常、良性肿瘤、恶性肿瘤的分类预测。

24、上述的设备或系统在基于拉曼光谱特征进行智能预测与图像分析的应用;可选的,所述预测或分析包括对患者进行癌症、良性肿瘤和正常的预测与分析;

25、上述的设备或系统在辅助疾病诊断及癌症筛查中的应用;可选的,所述疾病诊断包括对乳腺癌的初级筛查和预测分析,通过自动确定最基本的诊断特征,以提高血清分析和分化效率,所述癌症筛查包括有利于实现更多更大规模人群的乳腺癌 症筛查,特别是有利于在基层大规模开展乳腺癌患者的早期筛查。

26、本发明利用拉曼光谱检测乳腺癌患者、良性病例和健康受试者的血清,通过采集各组血清光谱数据,采用多变量统计分析整个光谱特征,基于机器学习分类模型自动确定最基本的显著性特征,以提高血清分析和分化效率,得到预测结果,大大减少患者承受的创伤、巨大的精神压力和高额的医疗费用,克服了特异性中等、假阳性率高、对微小钙化性病变显示不满意、检查时间长、费用昂贵的问题,实现了对乳腺癌的智能化预测,具有很强的创新性。

27、本技术的优点:

28、1.本技术创新性的公开一种利用拉曼光谱检测乳腺癌患者、良性病例和健康受试者的血清,通过获取的拉曼光谱样本数据,建立有效的乳腺癌筛查模型,作为一种初筛手段,客观地提高了数据分析的精度和深度;

29、2.本技术创新性的探索将普通拉曼光谱应用于乳腺癌早期筛查的可行性,提供了一种客观、快速、方便、灵敏的辅助乳腺癌筛查的机器学习分类模型,实现乳腺癌分类预测结果的智能学习与自动分析,时效明显;

30、3.本技术创造性的公开了基于拉曼光谱检测患者血清的图像数据,根据拉曼光谱特征峰信息建立相应模型,更有效地实现了一种更安全、快速、实时、无创、无标记、灵敏度高、精准方便的辅助乳腺癌筛查的分类预测,效能更好,以在乳腺癌早期筛查方案选择及分类分析中提供更充分的支持和潜在应用价值。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1