一种医学领域图像语义相似度矩阵的生成方法_4

文档序号:9433125阅读:来源:国知局
,标注词表达的内 容愈具体,内在语义属性愈丰富。若任意标注词节点语义距离相同,标注词的节点深度和愈 大,标注词所表达的图像间的语义相似距离愈越小。
[0130] 节点层次语义距离影响因子:
[0131] 式中,Depth(C)指标注词节点深度的求和函数。
[0132] 节点非对称性是对于节点对(A, B),若满足Sim(A, B)辛Sim(B,A),则称该节点对 (A,B)为非对称节点。提出非对称语义距离影响因子:
[0134] 通过引入横向节点透明度算子、纵向节点深度算子以及非对称算子,使最终语义 相似度度量结果更加精确。其中,横向节点透明度算子采用基于标注词的横向节点透明度 属性作为输入,纵向节点深度算子采用基于标注词的纵向节点深度属性作为输入,非对称 算子采用基于标注词节点非对称属性作为输入,通过计算图像间语义距离并作加和,用线 性加权的方法输出属性值,形成基于多角度的语义距离相似度矩阵。
【主权项】
1. 一种医学领域图像语义相似度矩阵的生成方法,其特征在于:通过计算机调取医学 领域图像知识库内数据,并按如下步骤进行处理: 步骤1.用贝叶斯概率模型对医学领域图像知识库中的领域图像进行语义信息的标 注,并对标注词赋以权值,获得赋有权值的标注词;将赋有权值的标注词的集合记为"语义 向量空间"; 步骤2.对由步骤1获得的赋有权值的标注词提取离散化的特征,获得包含离散化特性 的赋权标注词;即该包含离散化特性的赋权标注词与对应的领域图像一一对应;所述包含 离散化特性的赋权标注词的集合称为"图像属性的语义空间"; 步骤3.对步骤2所获得的"图像属性的语义空间"进行约简处理,获得特征属性,由特 征属性构建维度最简的约简集;所述约简包括四个步骤:构造可辨识差别矩阵,求解可辨 识差别矩阵的核,删除可辨识矩阵的差别属性项,获得维度最简的约简集; 步骤4.由步骤3获得的维度最简的约简集构建领域图像语义相似度的计算模型,通过 领域图像语义相似度的计算模型获得医学领域图像语义相似度矩阵。2. 根据权利要求1所述的一种医学领域图像语义相似度矩阵的生成方法,其特征在 于: 在步骤1中,将领域图像进行区域分割,形成图像集合{Pl,P2……};采用人机交互 的方式对领域图像进行语义标注,形成标注词集合{Cl,C2……};计算标注词集合{C1, C2……}中的每个标注词的后验概率,获取带权值信息的语义向量空间,该带权值信息的语 义向量空间的集合即为语义向量空间集合;领域图像是指影像报告中的图片,医学领域图 像知识库是由领域图像构成的集合; 在步骤2中,将由步骤1获得的带有权重的语义向量空间集合作为输入量,构建条件决 策表;计算图像属性的决策阈值参数j,通过动态阈值迭代,遍历连续图像属性的区间划分 端点,获取离散图像属性,将离散区间按递减序排列,得到图像属性的语义空间,记为离散 编码集合{A1,A2……}; 在步骤3中,利用带有双向指针的二叉树对步骤2获得的离散编码集合{Al,A2……} 的差别属性进行存储,并通过调整初次抽样系数P以及抽取函数f( Θ )的抽样阈值,构建可 变识差别矩阵,获取图像属性集合簇元素的多阶方阵,求解图像属性维度的约简集red (); 在步骤4中,由图像属性维度的约简集red(),计算标注词节点属性相似度、标注词节 点深度属性、标注词节点非对称属性,度量节点间横向语义距离、节点间纵向语义距离、度 量节点间非对称语义距离,利用标注词线性加权模型求解获得图像间语义相似度。3. 根据权利要求1或2所述的一种医学领域图像语义相似度矩阵的生成方法,其特征 在于:步骤1具体按如下步骤进行: 511 :初始化语义:通过人机交互的方式,抽取医生对于影像报告中图像的标注信息; 将抽取出的标注信息的初始权值清空,初始化关键词标注--即标注信息的赋值为〇 ;默认 所有语义权重对图像影响效果一样;形成语义标注词集合; 512 :将用户待比较语义输入计算机;计算机依据待比较语义对医学领域图像知识库 中的分类信息概念进行检索,获得检索出的图像; 由用户向计算机录入主关键词和非关键词;所述主关键字,是利用语义标注词集合与 基于医生对于不同科室的影像分类描述信息,做交集的结果,即为相似性检索的依据;所述 非关键词和主关键词互斥;计算机依据主关键词和非关键词互斥对检索出的图像进行标 记: 将与主关键词相关的图像标记为正相关;将标记为正相关的图像记入正相关数组,并 将组内每个图像标记的记数系数变量自加一次; 将与非关键词相关的图像一一即与主关键词无关的图像标记为检索负相关;将标记为 负相关的图像记入负相关数组,并将组内每个图像标记的记数系数变量自减一次; S13 :分别向正相关数组、负相关数组添加正相关图像、负相关图像,同时记录与该数组 相关的语义,得到正相关语义词组与负相关语义词组; 采用分水岭算法分别对正相关语义词组与负相关语义词组进行区域分割,将计算出分 割后区域图像的条件密度函数作为图像固有属性的主属性,进而获取后验概率值,比较筛 选出概率值最大数值的区域,并以此按照概率值最大数值递减排序;本步骤中只统计前20 个权值的赋值,即选取由大至小排列的取值中的前20个概率值,作为描述相应区域对应语 义标注的权重,进行语义标注,赋予相应的权值;即获得带权重正相关数组; S14:统计图像中被分割区域的正反馈语义标注词所在的数组权重之和,将其作为本组 的数组权重,同时对数组内权重最大的语义标注词做朴素贝叶斯分类,计算其的后验概率, 则图像分割区域的最终权重即为其对应语义标注词的数组权重与后验概率之和; S15 :将前述步骤获得的图像固有属性集合与对应的带权重语义标注词做基于概率空 间的映射连接,形成语义向量空间。4. 根据权利要求3所述的一种医学领域图像语义相似度矩阵的生成方法,其特征在 于:步骤2具体按如下步骤进行: 521 :将语义向量空间中的图像固有属性按的出现次数从小到大排序,并将相邻属性值 划分为一个等价类;基于条件语义属性,遍历出上述等价类之间的区域临界点,并以此作为 初始语义属性的起点区间,计算获得条件决策熵; 522 :对区域临界点与决策熵进行比较:对相邻区间端点决策熵的数值做差,若左端点 决策熵小于右端点决策熵,则调换该区间的左右语义属性值,遍历与计算每个条件语义属 性的条件信息量,并按数值递减排序,每次遍历,保留数值最大的条件语义属性,以此作为 区间合并的方向决策条件,将相邻区间合并为单个区间; 523 :将条件决策熵排序:采用基于动态反馈的阈值调整方法设定阈值:若决策阈值大 于区间左端点决策熵,则将该决策熵所对应的语义属性添加入粗划分组;反之,将该决策熵 所对应的语义属性划入细划分组;通过遍历相邻决策熵端点差值最小区间,动态调整决策 阈值,直到决策阈值不再大于区间左端点决策熵时,将决策熵值所对应的语义属性与细划 分组内的语义属性所在的离散区间排序; 524 :若步骤S23对决策阈值的修改结果导致条件决策语义属性出现完全相同的领域 区间,则取消步骤S23条件数值对调,还原成本区间的初始状态,将划分后的离散区间按其 左端点由大到小排序,依次从大于〇的正整数进行编码,获得编码区间集合{A1,A2……}; 若步骤S23对决策阈值的修改结果未导致条件决策语义属性出现完全相同的领域区 间,则保留步骤S23的阈值,将划分后的离散区间按其左端点由大到小排序,依次从大于0 的正整数进行编码,获得编码区间集合{A1,A2……}。5. 根据权利要求4所述的一种医学领域图像语义相似度矩阵的生成方法,其特征在 于:步骤3具体按如下步骤进行: 531 :初始化离散编码集合{A1,A2……}的属性维度最简约简集,置red〇 = <i),C〇re() =Φ ;用初次抽样步长β,抽取函数f ( Θ )分割离散编码集合{A1,A2……}内的数据,获得 子编码集合IU1U2U 3……},使子编码集合IU1U2U3……}的每一部分的Iind(A) I = 0 ;incKA) 表示基于集合A条件下的决策熵; 532 :构建子编码集合IU1U2U3……}的条件属性等价关系集;并由此计算获得分类集合 簇元素 Hil j, 1 < i,j < Θ ; Θ为为集合簇元素的二维坐标端点; 533 :构造可辨识差别矩阵:由分类集合簇元素 Hilj构建可辨识差别矩阵M d(i,j)= {1?},所述可辨识差别矩阵%(1,」)为Θ阶方阵,其具体结构为:求解可辨识差别矩阵Md(i,j)的最小不可约简核coreO ; 534 :判断可辨识差别矩阵Md(i,j)的秩是否为空: 若为空,则删除可辨识矩阵Md(i,j)的差别属性项后,求解维度最简的约简集,获得约 简差别属性集合; 若不为空,则直接求解维度最简的约简集,获得约简差别属性集合; 535 :对约简差别属性集合差别属性进行不一致判断: 用抽样未使用到的剩余对象做分类不一致性判断,即使用步骤S34中可辨识差别矩阵 中差别属性集合的补集元素,做分类不一致性判断:; 若分类不一致的对象数量不小于基于动态反馈的阈值参数j,返回步骤S33,动态调整 中的阈值大小; 若分类不一致的对象数量小于基于动态反馈的阈值参数j,则将维度最简的约简集作 为结果输出。6.根据权利要求5所述的一种医学领域图像语义相似度矩阵的生成方法,其特征在 于:步骤4具体按如下步骤进行: 由步骤3的结果分别计算获得标注词横向节点属性、标注词纵向节点深度属性: S41 :对维度最简的约简集进行语义标注词集合处理,所述语义标注词集合是对图像特 征标准化描述; 基于标注词横向节点属性,计算图像间语义距离并作加和; 通过计算一对标注词节点所包含的共有属性量和差异属性量,衡量标注词间的语义距 离,语义距离与共有属性成线性正相关,和差异属性成线性负相关; 本步骤中只考虑相邻节点(a,b)间的相似度计算,语义距离等于a节点的上层父类节 点属性集合与a节点的特征集合之间求并集;标注词节点的直接子节点数量愈多,对其细 化
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1