基于病历数据库的虚拟名医的制作方法

文档序号:9432923阅读:538来源:国知局
基于病历数据库的虚拟名医的制作方法
【技术领域】
[0001] 本发明涉及医疗数据挖掘领域,更具体地说,涉及一种基于病历数据库的虚拟名 医。
【背景技术】
[0002] 虚拟名医的目的是通过信息技术模拟现实医生诊疗过程,利用数据挖掘技术从病 历中"学习"医生的诊疗经验,通过检索到最为相似的病历为医生或者网上用户提供诊断建 议。传统医疗中,医生通过结合患者的自诉、体征、病史、医学影像等主要诊疗判据为患者诊 断。病历是医生工作内容的记录,内容上包含了患者的个人信息、病史、治疗过程及结果,但 本质上这些信息确蕴含了医生的诊断经验。电子病历是医疗信息化的必然产物,包含了患 者自诉、体征、病史、医学影像等主要患者信息,并且具备传统纸质病历所不具备的优点,比 如便于保存、传阅以及作为医疗数据挖掘的数据源。近年来,有关电子病历的应用研究逐渐 增多,但大多数仅限于提高电子病历的结构化存储能力,用于记录患者的症状和治疗过程, 而对其包含的大量信息再应用涉及较少。电子病历既是患者的诊疗过程的记录,也是医生 经验的载体,其包含了医生的经验以及患者个体化差异的大量信息。所以对于电子病历的 信息挖掘,会极大地发挥电子病历信息资源的临床价值。目前在医疗数据挖掘领域主流的 研究方向是医学图像搜索。

【发明内容】

[0003] 本发明的目的是提供一种基于病历数据库的虚拟名医,以充分发挥电子病历信息 资源的临床价值,为医生或者用户提供诊疗建议。
[0004] 本发明的具体技术方案如下:
[0005] -种基于病历数据库的虚拟名医,所述病历数据库记载了已诊疗患者的患者自 述、检查结果、医学影像以及诊疗方案,所述虚拟名医包括:
[0006] 病历数据录入装置,用于录入待诊疗患者的患者自述、检查结果以及医学影像;
[0007] 自诉相似度计算模块,用于计算待诊疗患者与病历数据库记载的已诊疗患者针对 患者自诉的相似度指标;
[0008] 诊断经验相似度计算模块,用于计算待诊疗患者与病历数据库记载的已诊疗患者 针对检查结果的相似度指标;
[0009] 医学影像相似度计算模块,用于计算待诊疗患者与病历数据库记载的已诊疗患者 针对医学影像的相似度指标;
[0010] 综合相似度计算模块,用于将针对患者自诉、检查结果和医学影像的三个相似度 指标,以及基于专家打分的患者自诉、检查结果和医学影像三者的临床判断重要性指标相 融合,计算待诊疗患者与病历数据库记载的已诊疗患者的综合相似度;以及 [0011] 诊疗方案生成模块,用于从病历数据库选出综合相似度最高的已诊疗患者的病历 并输出其诊疗方案。
[0012] 在上述的基于病历数据库的虚拟名医中,优选地,所述自诉相似度计算模块为文 本相似度计算模块,自诉相似度计算模块设置有关键词的同义词表,用关键词计算相似度 包括用关键词及其同义词计算相似度。
[0013] 在上述的基于病历数据库的虚拟名医中,优选地,所述诊断经验相似度计算模块 包括:
[0014] 层次模型构造子模块,用于以待诊疗患者的已检查的项目为准则、病历数据库中 记载的已诊疗患者的病历为待选方案建立目标层-准则层-方案层三层结构的层次模型;
[0015] 权重计算子模块,用于计算准则层相对于目标层的权重,其权重计算方法包括:用 各个已检查的项目与疾病的关联度指数构造准则层相对于目标层的判断矩阵,将判断矩阵 的各行向量进行几何平均,然后进行归一化处理得到准则层相对于目标层的权重;
[0016] 单项相似度计算子模块,用于计算待诊疗患者与病历数据库记载的已诊疗患者针 对单个检查结果的相似度;以及
[0017] 多项综合相似度计算子模块,用于将相对同一个已诊疗患者的各个单项相似度与 权重对应相乘获取诊断经验相似度。
[0018] 在上述的基于病历数据库的虚拟名医中,优选地,在所述单项相似度计算子模块 中,采用距离系数来判定针对单个检查结果的相似度。
[0019] 在上述的基于病历数据库的虚拟名医中,优选地,在所述单项相似度计算子模块 中,所述距离系数为相对海明距离Dlin,单项相似度Slin计算如下:
[0021] 其中,i和j表示进行比较的两个病历,η代表第η个检查项目,Xk表示已检查项 目第k个指标,Xkniax表示所有病历中项目η的第k个指标的最大值,X k_表示所有病历中项 目η的第k个指标的最小值,m为指标个数,0 < D1 jn< m。
[0022] 在上述的基于病历数据库的虚拟名医中,优选地,所述医学影像相似度计算模块 包括:
[0023] 图像预处理子模块,用于对医学影像进行预处理;
[0024] ROI分割子模块,用于采用GMM算法从预处理后的医学影像中分割出感兴趣区域;
[0025] 特征提取子模块,用于提取感兴趣区域的面积A、周长C以及最小外接矩形的面积 A2,并提取整幅图像的总面积Area ;
[0026] 图形描述子构造子模块,用于利用所述整幅图像的总面积Area、以及所述感兴趣 区域的面积A、周长C和最小外接矩形的面积A2构造感兴趣区域的图形描述子Ci1, i = 1, 2,3,4,5,其中,
[0028] α 4, α 5是感兴趣区域的边界特征,通过获取感兴趣区域的边界像素点,求取其 重心及边界上每一个点到重心的距离,然后对这组距离值计算其平均值和方差,分别作为 α 4, α 5的值;以及
[0029] 相似度计算子模块,通过计算两个医学影像中感兴趣区域的图形描述子之间的欧 氏距离,再取倒数后作为两个医学影像的相似度。
[0030] 在上述的基于病历数据库的虚拟名医中,优选地,在所述ROI分割子模块中,采用 GMM算法从预处理后的医学影像中分割出感兴趣区域的方法包括:
[0031] 通过高斯混合模型计算医学影像中每个像素点灰度的加权概率密度,与加权概率 密度的经验区间比较区分出正常点和异常点,将正常点和异常点的灰度值置为两个不同的 固定值从而得到该医学影像的二值图像;
[0032] 用矩形窗扫描所述二值图像,找出包含异常点最多的区域;以及
[0033] 用区域增长算法处理所述的包含异常点最多的区域,作为该医学影像中的感兴趣 区域。
[0034] 本发明分别针对患者自述、医生诊疗经验和医学影像三部分数据进行相似度计 算,综合这三种相似度得到电子病历的综合相似度,这种全面的相似度衡量策略能够有效 提尚虚拟名医的可靠性,检索到最相似的病历为医生或者其它用户诊断疾病和制定治疗计 划提供参考。
【附图说明】
[0035] 图1为一些实施例虚拟名医的流程图;
[0036] 图2为一些实施例中医学影像相似度计算模块的流程图;
[0037] 图3为一些实施例中图像预处理结果;
[0038] 图4为一些实施例中ROI定位结果。
【具体实施方式】
[0039] 下面结合附图和实施例对本发明进一步说明。这些更详细的描述旨在帮助理解本 发明,而不应被用于限制本发明。根据本发明公开的内容,本领域技术人员明白,可以不需 要一些或者所有这些特定细节即可实施本发明。而在其它情况下,为了避免将发明创造淡 化,未详细描述众所周知的操作过程。
[0040] 图1示出了一些实施例虚拟名医的流程,该虚拟名医是基于病历数据库实现的, 所述病历数据库记载了已诊疗患者的患者自述、检查结果、医学影像以及诊疗方案。参照图 1,所述虚拟名医包括:病历数据录入装置S100,自诉相似度计算模块S200,诊断经验相似 度计算模块S300,医学影像相似度计算模块S400,综合相似度计算模块S500,诊疗方案生 成模块(图中未示出)。
[0041] 病历数据录入装置SlOO用于录入待诊疗患者(也称作新患者)的患者自述、检查 结果以及医学影像。
[0042] 自诉相似度计算模块S200用于计算待诊疗患者与病历数据库记载的已诊疗患者 针对患者自诉的相似度指标。患者自诉是纯文本形式的数据,患者自诉中有很多临床表现 是衡量患者自诉相似度的关键词,同时临床表现出现的频率很高,而且对于含义相同的术 语,不同的医生可能会有不同的表达方式,因此有必要建立关键词的同义词表,用关键词计 算相似度时包括用关键词及其同义词计算相似度,这样就能实现在衡量相似度时把同义词 组作为相似的。为了计算此类数据的相似度,以肺癌病种为例,首先需要依据语义分析技术 为肺癌病种建立同义词表,覆盖肺癌病种常见的专业术语和通俗表达形式。根据同义词表, 利用目前已相对成熟的文本检索技术可以直接获得患者自诉间的相似度。目前,计算文本 相似度
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1