基于病历数据库的虚拟名医的制作方法_2

文档序号:9432923阅读:来源:国知局
的技术已较为成熟,虚拟名医是依托于互联网存在的,通过调用MySQL命令即可获 得针对患者自诉的相似度指标S1。
[0043] 诊断经验相似度计算模块S300,用于计算待诊疗患者与病历数据库记载的已诊疗 患者针对检查结果的相似度指标。对于医生诊断经验的相似度衡量依据如下:在诊断过程 中,医生综合考虑患者的各项检查结果(或者称作指标),根据自身经验和医疗常规对不同 的信息予以不同的重视程度,同时结合患者自述对患者的病情予以初步的诊断。一些实施 例中,在计算医生诊断经验的相似度时,将患者的各个检查项目结果(即各项检查结果)纳 入衡量范围,以海明距离衡量单个检查项目结果的相似度(即单项相似度),同时利用层次 分析法获得各项指标对于诊断结果的影响权重,通过单项相似度乘以对应的影响权重然后 求和,即可求得医生诊断经验的相似度指标。
[0044] 在一些更具体的实施例中,诊断经验相似度计算模块S300包括以下子模块:层次 模型构造子模块,权重计算子模块,单项相似度计算子模块,多项综合相似度计算子模块。
[0045] 层次模型构造子模块用于以待诊疗患者(新患者)的已检查的项目为准则、病历 数据库中记载的已诊疗患者的病历为待选方案建立目标层-准则层-方案层三层结构的层 次模型。
[0046] 权重计算子模块用于计算准则层相对于目标层的权重,其权重计算方法包括:用 各个已检查的项目与疾病的关联度指数构造准则层相对于目标层的判断矩阵,将判断矩阵 的各行向量进行几何平均,然后进行归一化处理得到准则层相对于目标层的权重。举例来 说,假设新患者已做了 El,E2, E3, E4, E5, E6,这些检查即是层次模型的准则层。首先构造 出准则层相对于目标层的判断矩阵,判断矩阵中的每个元素指代的是每一项检查结果的相 对重要性,由经验医生给出,举例如下:
[0050] 通常G1」与e u呈倒数关系。
[0051] 接下来,利用判断矩阵确定各准则相对于目标的权重系数,具体的,将判断矩阵的 各行向量进行几何平均,然后进行归一化处理得到目标层的权重。对于上述例子,将上述判 断矩阵A各行向量进行几何平均,由
[0053] 此处η = 6,可得,
[0055] 对W向量归一化,由
[0057] 得到
[0059] 为了获得更好效果,进一步地,还包括:计算判断矩阵的最大特征根,利用最大特 征值计算一致性指标,检验判断矩阵的一致性,获得具有良好一致性的权重。具体的,根据
[0061] 计算判断矩阵的最大特征根λ _;由
[0063] 计算一致性指标CI,与平均随机一致性指标RI计算得到判断矩阵的一致性比率 CR = CI/RI,若CR小于0. 1,说明判断矩阵具有满意的一致性,不需要调整,权重系数w可 用。
[0064] 单项相似度计算子模块用于计算待诊疗患者与病历数据库记载的已诊疗患者针 对单个检查结果的相似度。在获得每项检查的权重系数之后,需要确定新患者的每一项检 查与其他患者(病历数据库记载的已诊疗患者)的同一检查的相似度。一些实施例中采用 距离系数来判定针对单个检查结果的相似度。距离系数主要包括绝对距离(即海明距离) 和欧氏距离,相比而言,绝对距离更能反映两序列之间的值相似程度,所以一些较佳实施例 中采用基于海明距离的方法衡量单项相似度,如下所述
[0066] 其中η为患者所接受的第η项检查,m为此项检查项目下可量化的诊断指标数量。 由于在比较病历的相似程度上,每个用于比较的指标意义不同,量纲不同,为了去除量纲的 影响,一些更佳实施例中还对海明距离进行了改进,使用相对海明距离:
[0068] 具体的,单项相似度Sljn计算如下:
[0070] 其中,i和j表示进行比较的两个病历,η代表第η个检查项目,Xk表示已检查项 目第k个指标,Xkniax表示所有病历中项目η的第k个指标的最大值,X k_表示所有病历中项 目η的第k个指标的最小值,m为指标个数,0 < D1 jn< m,可知0 < S i jn< 1。对于上述例 子,对每一检查项目计算其单个相似度得相似度向量:
[0071] Sij - Sij2 Sij3 Sij4 Sij5 Sij6] 〇
[0072] 多项综合相似度计算子模块用于将相对同一个已诊疗患者的各个单项相似度与 权重对应相乘获取诊断经验相似度。具体地,通过
[0073] S2= S u*w
[0074] 即可计算出医生诊断经验的相似度指标S2。
[0075] 医学影像相似度计算模块S400用于计算待诊疗患者与病历数据库记载的已诊疗 患者针对医学影像的相似度指标。以肺癌CT为例,首先定位肺癌肿瘤的位置,然后利用区 域增长法获取肿瘤区域,提取肿瘤区域的几何特征组成特征向量,通过计算特征向量间的 欧氏距离即可作为图像相似度指标。
[0076] 图2示出了一些实施例中医学影像相似度计算模块S400的流程。参照图2, 一些 实施例中的医学影像相似度计算模块S400包括:图像预处理子模块S410, ROI分割子模块 S420,特征提取子模块S430,图形描述子构造子模块S440,相似度计算子模块S450。
[0077] 图像预处理子模块S410用于对医学影像进行预处理。以肺癌CT为例,图像中背 景的灰度值较低,因此我们可以通过大津阈值法分割人体部位,然后对分割产生的二值图 像进行腐蚀处理,从而得到胸腔外壁的大致轮廓。此外,在某些断层CT图像中含有CT设备 的局部零件的成像,这些部位的成像存在于CT图像的边缘,因此可以直接将CT图像的边缘 区域灰度值置零。经过以上处理,利用图像的水平和垂直方向上的灰度累计便可以获得与 胸腔外壁相切的矩形从而可以去除胸腔外壁以外的区域。预处理结果如图3所示,图3中 的子图a为肺癌CT原始图,子图b为经分割和腐蚀处理后的结果,子图c为去除胸腔外壁 以外的区域后的结果。
[0078] ROI分割子模块S420用于采用GMM算法从预处理后的医学影像中分割出感兴趣区 域(ROI)。ROI分割环节首先使用了 GMM算法定位肿瘤。以肺癌CT为例,将肺癌CT图像中 的正常区域看做背景,异常区域,即肿瘤区域当作前景。GMM的目标就是区分图像的背景和 前景。相比于异常区域,正常区域的图像特征更为稳定,因此统计正常区域的灰度值分布规 律就相对更容易而且其分布规律的适用性也更高。使用η幅来自不同正常个体的相近解剖 层的肺部CT图像作为训练样本,并对所有样本进行预处理。训练出的高斯混合模型则是正 常肺部CT图像灰度值的分布模型。以此模型区分肺癌CT图像中正常区域和异常区域。
[0079] 在一些更具体的实施例中,采用GMM算法从预处理后的医学影像中分割出感兴趣 区域的方法包括:通过高斯混合模型计算医学影像中每个像素点灰度的加权概率密度,与 加权概率密度的经验区间比较区分出正常点和异常点,将正常点和异常点的灰度值置为两 个不同的固定值从而得到该医学影像的二值图像;用矩形窗扫描所述二值图像,找出包含 异常点最多的区域;以及用区域增长算法处理所述的包含异常点最多的区域,作为该医学 影像中的感兴趣区域。举例来说,以I1,12, ...,In表示η幅经过预处理的正常肺部CT图像。 In是预处理后的矩阵。P n(x,y)是第η幅图像(X,y)点的像素值。我们将pn(x,y),(η = 1,2, 3...)作为一个独立的点集,每一个点集都对应一个独立的高斯混合模型,此模型便是 这个点集的概率分布密度函数。假设这个高斯混合模型函数如下式所示:
[0082] 其中,g(pn(x,y),μ i,〇 J是第个高斯分布在pn(x,y)上的概率密度,α ;是这个 高斯分布的权重。P(Pn(X,y))是Pn(X,y)在这个混合高斯分布中的加权概率密度。其中, 公式里的参数及其相应的限制条件如下:
[0084] U1, μ 2, , μ κ
[0085] 〇ι,〇2,···,
[0086] 对于每一个点集的混合高斯模型来说,需要确定的参数有3ΧΚ个。这里采用 Expectation Maximization Algorithm确定这些参数。在实验中,K= [2,4]时,肿瘤区域 定位的准确性最高。以正常肺部CT图像为训练集所建立的高斯混合模型能够很好的拟合 肺部CT图像正常区域中每一个像素点灰度的概率分布密度。如果某一部位存在肿瘤,那么 此部位的灰度值与相应部位在正常情况下的灰度值之间必定存在差异,从而导致由高斯混 合模型得出的加权概率密度是一个异常值。因此,只需判断某一点的加权概率密度是否异 常即可确定它是否是异常点。为了判别某一点是否是异常点,实例中通过多次实验确定了 一个加权概率密度的经验
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1