一种医学领域图像语义相似度矩阵的生成方法_5

文档序号:9433125阅读:来源:国知局
的标注词语义描述就越具体,即其所含子类节点之间的语义相似度就愈大;该标注词节 点属性信息量影响因子为:> 式中,O (C1, C2)表示标注词节点(cl, c2)并运算的共有属性集合;〃(?? ?·.:)与 .0(? 〃.·2 )表示标注词节点(cl, c2)的差异属性量;λ、α表示公式调节参数,避免分式无 意义; 542 :基于标注词纵向节点深度属性,计算图像间语义距离并作加和; 任意一组标注词在语义树中的节点深度之和愈大,该标注词表达的图像属性愈具体, 语义相似度距离愈小,相似度愈高,本发明通过指数函数来描述节点层次的语义相似度;该 标注词的节点层次影响因子为:543 :由节点层次影响因子计算获得非对称因子:基于标注词节点非对称属性,在标注 词语义树中,标注词节点间的语义相似度在一定程度上具有非对称性,即语义相似度距离 匹配带有方向性;标注词节点与祖先节点的相似度值大于其祖先与子节点的相似度取值, 若概念A为概念B的祖先,sim(A,B)要小于sim(B,A)。节点对(cl,c2)语义距离非对称属 性影响因子为:S44:用线性方法加权的方法将节点属性信息量影响因子、非对称属性影响因子进行整 合,形成基于多角度的语义距离相似度矩阵: 通过标注词线性加权模型 SinKc1, C2) = ε SimC (C1, C2) +(1- ε ) SimDy (C1, C2)将节点属性信息量影响因子、非对 称属性影响因子进行整合,形成基于多角度的语义距离相似度矩阵,实现语义标注词之间 相似度距离度量的基本特征: 本式中,ε表示权重因子,调整标注词节点共有属性量和深度对语义距离度量的影 响; 本式对(cl,c2)语义相似度距离度量范围是0到1闭区间,值愈大,语义距离愈近; 本式对(cl,c2)是相同一节点时,语义相似度值为1 ; 本式对(cl, c2)在标注词语义树中的共有部分越大,即共有属性越集中,语义距离愈 近; 本式对(cl,c2)在标注词语义树中位置愈深,属性愈聚向,语义距离愈近。7.根据权利要求3所述的一种医学领域图像语义相似度矩阵的生成方法,其特征在 于: 在步骤1中,通过人机交互的方式,将影像报告中医生对于医学图像库中相应图像的 描述作为语义内容,根据医学分类知识,提取出标注词集合,定义此集合为描述图像语义信 息的特征向量;即将领域图像中的"图像+语义标注词"作为一组元素; 步骤1中的始化关键词标注,是将语义标注用可数字化的权重值表示,初始赋值为0, 构成包含语义标注词的目标列表; 在步骤1中,利用待比较语义与图像库中的分类信息概念做检索,对检索出的图像进 行标记: 所述的"分类信息"是基于医生对于不同科室的影像的分类描述信息,与待比较的语义 标注词做相似性检索,检索中该图像每出现一次,就对出现影像的语义标注词做正向标记, 同时将正向标记记数变量自加一次; 将与主题图像无关的图像标记为检索负相关,同时将负向标记记数变量自加一次,有 关联的图像标记为正相关,同时将负向标记记数变量自加一次,进而获取领域对象的横维 和纵维信息,其中,横坐标对应正向标记记数变量的变化,纵坐标对应负向标记记数变量的 变化; 本步骤中,将正反馈语义所在的数组权重增加,是对正反馈语义标注词所在的数组,利 用遗传算法进行权重静态优化,并将该组权重值的初始动态调节系数设为大于1的常数; 本步骤中,将负反馈的数组权重减少,是逆向调整负反馈权重的初始动态调节系数,并 将其值设为小于1的常数; 本步骤中,判断图像属性的子集属性是否为空值后的处理方法是:若非空,添加新的语 义标注的属性加入目标列表;反之,停止添加; 将图像的语义标注词数量作为衡量该图像语义范围的依据,若图像a的语义标注词集 合恰为另一图像b的语义标注词集合的真子集,则定义图像a是图像b的子集; 本步骤中,采用分水岭算法对目标图像区域进行区域分割,计算出分割后的区域图像 的条件密度函数,获取后验概率值,比较筛选出概率值最大数值的区域,并以此按照数值递 减排序,对相应区域赋权重值。8.根据权利要求4所述的一种医学领域图像语义相似度矩阵的生成方法,其特征在 于: 步骤2中所述的条件决策表,是由对象集合和条件决策熵所构成的二元关系,其中初 始条件语义属性X与条件决策Y构成基于对象的等价关系,条件决策熵H (YIX)表示已知条 件语义属性X的前提下,条件决策Y的粗糙程度;条件决策表的计算方法如下:本步骤中,将语义属性按出现次数从小到大排序,并将相邻对象划分为一个等价类,基 于条件语义属性,遍历出上述等价类之间的区域临界点,以此作为初始语义属性的区间端 点;对每个每个离散后的图像语义属性计算其条件决策熵,并比较相邻区间中条件信息量 的大小; 所述信息量的大小的界定如下:将图像的语义标注词作为其条件语义属性,并将条件 语义属性和决策语义属性的比值表示成相邻区间合并操作的条件信息量,对于给定的条件 决策表,上述比值愈大,表明该条件语义属性对决策语义属性愈重要;遍历与计算每个条件 语义属性的条件信息量,并按数值递减排序,若出现数值相同的情况,则按照等价类的断点 数量由大到小一次排列,淘汰掉排列位置靠后的条件语义属性;本步骤中,每次遍历,保留 数值最大的条件语义属性,以此作为区间合并的方向决策条件; 由条件决策表划分最小数,同时将条件决策熵排序,并通过设定决策阈值,将条件决策 熵划分为粗粒度组与细粒度组,每次挑选端点条件决策熵区间的两端点差值最小的语义属 性一一将条件决策表中相邻的条件语义属性较小的取值替换为较大的数值;将条件决策表 中相邻的条件语义属性数值对调,保证该领域的左端点值始终大于右端点值,以防止过度 拟合;若修改结果引起数值冲突,即修改结果引起条件决策语义属性出现完全相同的领域 区间,则删除此次修改,将领域区间再次对调,还原成本区间的初始状态;最后,将划分后的 离散区间按其左端点由大到小排序,依次从大于O的正整数进行编码。9. 根据权利要求5所述的一种医学领域图像语义相似度矩阵的生成方法,其特征在 于: 定义在步骤2中,未被划入语义标注词集合A的剩余标注词所构成的集合,为语义标注 子集B ; 对信息表数据进行特征离散化,是利用双向指针的二叉树对集合A-B进行差别语义属 性项的存储,降低数据的存储空间,并通过步骤2中的条件决策表,将连续的语义属性划分 成按权值由大到小排序的离散区间; 初次抽样步长,是人工输入的初次抽样系数,用以抽取分割信息表数据,构建子信息表 的条件语义属性等价关系集,建立可辨识差别矩阵分类集合簇元素,构成多阶方阵,即构造 可辨识差别矩阵;由可辨识差别矩阵求解可辨识差别矩阵的核;查找可辨识矩阵的条件语 义属性的差别属性项,是搜索出所有与条件语义属性等价类的核不相关的属性项,将该属 性项存储于单独的二叉树中,并为每个决策语义属性建立一个属性剪枝关联二叉树; 可辨识矩阵的条件语义属性的差别属性项,是求解维度最简的约简集判断依据:通过 遍历属性剪枝关联二叉树的标注词节点中权值小于2的个数,求和节点数量,同时使用抽 样未使用到的剩余对象做分类不一致性判断。10. 根据权利要求6所述的一种医学领域图像语义相似度矩阵的生成方法,其特征在 于: 在步骤4中,根据图像与标注词间的划分关系将其二元化,即利用二元关系构造标注 词语义树;根据语义标注词在语义树中的层次结构来确定属性特征集合;其中,所述层次 结构,是该二叉树的每一层语义标注词节点与条件语义属性一一对应;属性特征集合,通过 遍历,判断某节点的上层节点右孩子若为空,则此条件语义属性必存在一个非空的属性剪 枝关联二叉树; 随后,从节点属性信息量、节点层次以及节点非对称性三个方面对语义距离度量进行 扩展,其中, 节点属性信息量指标注词语义树外延标注词节点c所包含的直接子类节点数量,记做 〇(c);节点属性信息量影响因子为:式中,degree(anc12)表示概念节点1、2子节点数量;degree(fc)表示基于该节点所在 层内格结构中的各兄弟节点度的最大值; 节点层次指在基于所表达的标注词语义树中,若存在具有偏序集的二元关系标注词 层次格结构,则树中外延标注词节点与根节点的最短路径中所包含的边数之和;每个横向 层次标注词节点均是对上层节点的细化表达,节点所在的层级愈大,标注词表达的内容愈 具体,内在语义属性愈丰富。若任意标注词节点语义距离相同,标注词的节点深度和愈大, 标注词所表达的图像间的语义相似距离愈越小; 节点层次语义距离影响因子:式中,Depth(C)指标注词节点深度的求和函数; 节点非对称性是对于节点对(A,B),若满足Sim (A,B)辛Sim (B,A),则称该节点对(A,B) 为非对称节点。提出非对称语义距离影响因子:通过引入横向节点透明度算子、纵向节点深度算子以及非对称算子,使最终语义相似 度度量结果更加精确;其中,横向节点透明度算子采用基于标注词的横向节点透明度属性 作为输入,纵向节点深度算子采用基于标注词的纵向节点深度属性作为输入,非对称算子 采用基于标注词节点非对称属性作为输入,通过计算图像间语义距离并作加和,用线性加 权的方法输出属性值,形成基于多角度的语义距离相似度矩阵。
【专利摘要】本发明涉及一种领域图像间语义相似度矩阵的生成方法,以医学领域图像间语义距离为研究对象,通过多策略匹配的相似度关系映射,提出一种基于粗糙语义概率模型的医学图像相似矩阵提取建模方法,主要包括四个步骤:基于贝叶斯概率模型的语义标注、图像特征离散化、语义特征约简和基于多态理论的领域相似度模型计算。本发明能够有效的提高医学领域图像间语义信息合并的准确率,提升融合医学临床诊断领域知识库的质量,降低大规模挖掘图像语义信息所需的计算规模。
【IPC分类】G06K9/62
【公开号】CN105184307
【申请号】CN201510455087
【发明人】王凯
【申请人】蚌埠医学院
【公开日】2015年12月23日
【申请日】2015年7月27日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1