本发明涉及医学统计数据处理,具体涉及基于智能医学工程的高阶医学统计数据处理方法及系统。
背景技术:
1、在医学领域中,医院的数据库中每天会产生大量的医疗数据需要被收集和存储,这些医疗数据包含了丰富的医学信息,例如患者的病历数据、医学影像数据等,这些医疗数据的处理和分析对于医学研究、辅助医生进行疾病的诊断和治疗具有重要意义。但是医学统计的数据处理过程往往面临着影像数据量庞大、复杂性高以及模式提取困难等挑战。因此,利用基于智能医学工程的高阶方法来处理和分析医学统计数据就显得尤为重要。现有常通过对病历统计数据进行分析提取数据源,同时通过对医疗影像进行匹配,实现对比检索,但是该方法在进行数据源或者医疗影像的对比检索时,没有明确的分类体系,可能会导致一些信息被遗漏或者被错误地归类,降低了信息检索的效率。
技术实现思路
1、为了解决利用现有方法进行信息对比检索时没有明确的分类体系,使得信息检索的效率低下的技术问题,本发明的目的在于提供基于智能医学工程的高阶医学统计数据处理方法及系统,所采用的技术方案具体如下:
2、第一方面,本发明提供了一种基于智能医学工程的高阶医学统计数据处理方法,包括:
3、采集不同患者的病历数据和医疗图像以及患者的基础信息和医疗图像的病症信息;
4、根据每张医疗图像中病灶部分的特征分布提取病灶特征得到每张医疗图像的病理特征值;根据每张医疗图像的病理特征值、病症信息和患者的基础信息构建每张医疗图像的病症标签序列;
5、提取每个病历数据的医学关键词构成每个病历数据的关键词集合;根据关键词集合中每个关键词在病历数据中的分布情况和其他关键词在病历数据中分布情况之间的差异性,得到关键词集合中每个关键词的重要性程度;利用所述重要性程度对关键词集合中所有关键词进行筛选获得每个病历数据的医学标签序列;
6、根据不同的医疗图像的病症标签序列之间的相似情况对医疗图像进行分类,根据不同的病历数据的医学标签序列之间的分布差异对病历数据进行分类,获得医疗图像和病历数据的分类结果。
7、优选地,所述根据关键词集合中每个关键词在病历数据中的分布情况和其他关键词在病历数据中分布情况之间的差异性,得到关键词集合中每个关键词的重要性程度,具体包括:
8、对于任意一个关键词集合,根据每任意两个关键词在病历数据中的分布情况的重复情况得到每任意两个关键词之间的相关性参数;
9、将关键词集合中任意一个关键词记为目标关键词,将关键词集合中除目标关键词外其他的关键词均记为参考关键词;将任意一个参考关键词记为第一参考关键词,将与第一参考关键词相邻的下一个参考关键词记为第二参考关键词;
10、对目标关键词与每个参考关键词之间的相关性参数的归一化处理得到每个参考关键词对应的权重系数;
11、计算目标关键词与第一参考关键词之间的相关性参数和目标关键词与第二参考关键词之间的相关性参数的差值绝对值,对该差值绝对值进行负相关映射得到第一参考关键词的关联特征指标;
12、将每个参考关键词对应的权重系数与关联特征指标的乘积作为每个参考关键词的特征程度,计算所有参考关键词的特征程度的均值得到目标关键词的重要性程度。
13、优选地,所述根据每任意两个关键词在病历数据中的分布情况的重复情况得到每任意两个关键词之间的相关性参数,具体包括:
14、对于关键词集合中任意两个关键词,获取所述任意两个关键词同时出现在同一个病历数据中的次数记为第一系数,获取每个关键词在不同病历数据中出现的次数记为每个关键词的特征数量,对所述任意两个关键词的特征数量之间的乘积进行开平方处理得到第二系数;
15、根据所述第一系数和第二系数得到所述任意两个关键词之间的相关性参数,所述第一系数与相关性参数之间呈正相关关系,所述第二系数和相关性参数之间呈负相关关系。
16、优选地,所述利用所述重要性程度对关键词集合中所有关键词进行筛选获得每个病历数据的医学标签序列,具体包括:
17、对于任意一个关键词集合,将所有关键词按照重要性程度从大到小的顺序进行排列,按照排列顺序选取预设数量个关键词构成关键词集合对应的病历数据的医学标签序列。
18、优选地,所述根据不同的病历数据的医学标签序列之间的分布差异对病历数据进行分类,具体包括:
19、对于任意两个病历数据,根据病历数据的医学标签序列中每个关键词在所述任意两个病历数据中的另一个病历数据的医学标签序列中的位置分布情况,得到所述任意两个病历数据之间的相似度指标;
20、基于所述相似度指标对病历数据进行分类获得病历数据的分类结果。
21、优选地,所述相似度指标的获取方法具体为:
22、将任意两个病历数据分别记为第一病历数据和第二病历数据,将第一病历数据的医学标签序列中任意一个关键词记为第一关键词;
23、若第二病历数据的医学标签序列中不包括第一关键词,则第一关键词的指示系数的取值为0;若第二病历数据的医学标签序列中包括第一关键词,则第一关键词的指示系数的取值为1;
24、计算第一关键词在第一病历数据的医学标签序列中的位置序号与第一关键词在第二病历数据的医学标签序列中的位置序号之间的比值,对该比值与常数1之间的差值绝对值进行负相关归一化处理得到第一关键词的相似特征系数;
25、计算第一病历数据的医学标签序列中所有关键词的相似特征系数与指示系数之间的乘积的均值得到第一病历数据和第二病历数据之间的相似度指标。
26、优选地,所述根据每张医疗图像中病灶部分的特征分布提取病灶特征得到每张医疗图像的病理特征值,具体包括:
27、对于任意一张医疗图像,利用神经网络对医疗图像进行处理获得医疗图像中的病灶区域;
28、计算每个病灶区域的边缘长度和病灶区域的面积之间的乘积得到每个病灶区域的分布特征因子;将医疗图像中所有病灶区域的分布特征因子的均值作为医疗图像的病理特征值。
29、优选地,所述根据每张医疗图像的病理特征值、病症信息和患者的基础信息构建每张医疗图像的病症标签序列,具体包括:
30、所述病症信息包括医疗图像中每个病灶区域所在的器官以及病灶区域的病症名称;所述患者的基础信息包括患者的性别和年龄;
31、对于任意一张医疗图像,将医疗图像的病理特征值、医疗图像的病症信息、医疗图像对应患者的基础信息组成医疗图像的病症标签序列。
32、优选地,所述根据不同的医疗图像的病症标签序列之间的相似情况对医疗图像进行分类,具体包括:
33、利用词向量模型获取每张医疗图像的病症标签序列的特征向量,利用聚类算法基于每任意两个特征向量之间的欧氏距离,对医疗图像进行分类,获得医疗图像的分类结果。
34、第二方面,本发明提供了一种基于智能医学工程的高阶医学统计数据处理系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被处理器执行时实现一种基于智能医学工程的高阶医学统计数据处理方法的步骤。
35、本发明实施例至少具有如下有益效果:
36、本发明首先采集医疗图像、病历数据以及患者的基础信息和医疗图像的病症信息,为后续丰富数据进行多维度相似特征分析提供了数据基础。然后,通过提取医疗图像中的病灶部分的特征信息获得病理特征值,表征了医疗图像中病灶部分的严重情况,并结合多个方面的信息构建每张医疗图像的病症标签序列,表征了每张医疗图像对应的病灶特征标签信息。进一步的,再对病历数据进行特征分析,首先进行医学关键词提取,分析关键词集合中关键词在不同病历数据中的分布情况之间的差异性,获得每个关键词的重要性程度,重要性程度表征了对应关键词在关键词集合和对应病历数据中的核心程度的重要性大小,结合核心程度和重要性大小可以对关键词进行筛选,确定最终的医学标签序列,表征了病历数据中核心程度较强的标签信息。最后,利用医疗图像和病历数据自适应获取的标签信息进行分类,可以获得效果较佳的分类结果,医生利用分类结果进行信息对比检索时,可以有效地提高医学信息检索的效率和准确度,为医务工作者提供更好的支持和服务。