一种医学领域图像语义相似度矩阵的生成方法_2

文档序号:9433125阅读:来源:国知局
述主关键字,是利用语义标注词集 合与基于医生对于不同科室的影像分类描述信息,做交集的结果,即为相似性检索的依据。 所述非关键词和主关键词互斥。计算机依据主关键词和非关键词互斥对检索出的图像进行 标记:
[0044] 将与主关键词相关的图像标记为正相关。将标记为正相关的图像记入正相关数 组,并将组内每个图像标记的记数系数变量自加一次。
[0045] 将与非关键词相关的图像--即与主关键词无关的图像标记为检索负相关。将标 记为负相关的图像记入负相关数组,并将组内每个图像标记的记数系数变量自减一次。
[0046] S13 :分别向正相关数组、负相关数组添加正相关图像、负相关图像,同时记录与该 数组相关的语义,得到正相关语义词组与负相关语义词组。
[0047] 采用分水岭算法分别对正相关语义词组与负相关语义词组进行区域分割,将计算 出分割后区域图像的条件密度函数作为图像固有属性的主属性,进而获取后验概率值,比 较筛选出概率值最大数值的区域,并以此按照概率值最大数值递减排序。本步骤中只统计 前20个权值的赋值,即选取由大至小排列的取值中的前20个概率值,作为描述相应区域对 应语义标注的权重,进行语义标注,赋予相应的权值。即获得带权重正相关数组。
[0048] S14:统计图像中被分割区域的正反馈语义标注词所在的数组权重之和,将其作为 本组的数组权重,同时对数组内权重最大的语义标注词做朴素贝叶斯分类,计算其的后验 概率,则图像分割区域的最终权重即为其对应语义标注词的数组权重与后验概率之和。
[0049] 假设将目标图像g分割为η个区域,其中每个区域分别用R = Im1,m2, m3…… mj表示,由贝叶斯概率公式可以知道与该区域相对应的主题概念集C= {Cl,c2, C3…… cn},其中任意主题概念ci的后验概率为
上式 中PO是条件概率,fR()是以该区域集合为对象的边缘概率密度函数。分析该公式可知: fR (IHlllH2, m3......mn)是表示所有的与该图像有关联的边缘密度函数,是一个常量,若假定 主题标注是某一等概率事件,则分割所得的区域条件概率均相等,想使得上式最大化,只需 使得Um1, m2, m3......mn/Cl)最大化即可。为了获取该边缘密度函数的具体分布情况,不妨 假设该分割区域之间为相互独立关系,则该条件密度函数等价于如下公式:
[0050] fR Oii1, m2, m3......πιη/(^) = fR (Iii1Zci) X fR (Iii2Zci) X …X fR (πιη/(^)。
[0051] S15 :将前述步骤获得的图像固有属性集合与对应的带权重语义标注词做基于概 率空间的映射连接,形成语义向量空间。
[0052] 参见图2,步骤2具体按如下步骤进行:
[0053] S21 :将语义向量空间中的图像固有属性按的出现次数从小到大排序,并将相邻属 性值划分为一个等价类。基于条件语义属性,遍历出上述等价类之间的区域临界点,并以此 作为初始语义属性的起点区间,计算获得条件决策熵。
[0054] S22 :对区域临界点与决策熵进行比较:对相邻区间端点决策熵的数值做差,若左 端点决策熵小于右端点决策熵,则调换该区间的左右语义属性值,遍历与计算每个条件语 义属性的条件信息量,并按数值递减排序,每次遍历,保留数值最大的条件语义属性,以此 作为区间合并的方向决策条件,将相邻区间合并为单个区间。
[0055] S23 :将条件决策熵排序:采用基于动态反馈的阈值调整方法设定阈值:若决策阈 值大于区间左端点决策熵,则将该决策熵所对应的语义属性添加入粗划分组。反之,将该决 策熵所对应的语义属性划入细划分组。通过遍历相邻决策熵端点差值最小区间,动态调整 决策阈值,直到决策阈值不再大于区间左端点决策熵时,将决策熵值所对应的语义属性与 细划分组内的语义属性所在的离散区间排序。换言之,将决策熵值所对应的语义属性做离 散化排序,排序原则是依次将细化分组内与该语义属性相邻的离散区间做区间合并,直至 决策阈值与区间左端点决策熵相等,完成阈值的赋值。。
[0056] S24 :若步骤S23对决策阈值的修改结果导致条件决策语义属性出现完全相同的 领域区间,则取消步骤S23条件数值对调,还原成本区间的初始状态,将划分后的离散区 间按其左端点由大到小排序,依次从大于0的正整数进行编码,获得编码区间集合{A1, A2......} 〇
[0057] 若步骤S23对决策阈值的修改结果未导致条件决策语义属性出现完全相同的领 域区间,则保留步骤S23的阈值,将划分后的离散区间按其左端点由大到小排序,依次从大 于0的正整数进行编码,获得编码区间集合{A1,A2……}。
[0058] 参见图4,步骤3具体按如下步骤进行:
[0059] 首先,对不必要属性集、一簇不可分辨关系'可辨识差别矩阵、不可分辨简单介绍 如下:若P为一族等价关系,且R e P,IND(P-{R}) = IND(P),则称关系R为P不必要属性 集。若等价关系P中的任意关系R均为不必要属性集,则称R是依赖于等价关系P上的独 立关系集合。
[0060] 设Q、R均为一簇不可分辨关系,且Oet如果ind (Q) = ind (R),则称Q为R 的一个约简集,记为red (R)。R中所有必要关系所形成的集合称为关于集合R的核,记为 core (R)〇
[0061] 可辨识差别矩阵的定义,从属性的角度对条件属性与决策属性加以划分,定义如 下:对于任意的属性X,y e G,知识表达系统I = {U, A, V,f},其中A = M U {d}是属性集 合,子集M和{d}分别是条件属性集与决策属性集,f (a, s)能够唯一确定对象s关于属性a 的取值,可辨识差别矩阵Md表示为Md(i,j) = {a# M Λ Hani, sn)},其中d(Sn)辛d(Sni), 其他情况下Md (i,j)均为0。若信息系统S = (U,A,R),V是属性集A的一个非空子集,则 不可分辨关系//7i叩z) = Χ(,'? ? e ^,称X,y是在属性V上不可分辨。
[0062] 本步骤的具体步骤如下:
[0063] S31 :初始化离散编码集合{Al,A2……}的属性维度最简约简集,置red () = Φ, coreO = Φ。用初次抽样步长β,抽取函数f ( Θ )分割离散编码集合{A1,A2……}内的数 据,获得子编码集合IU1 U2 U3……},使子编码集合IU1 U2 U3……}的每一部分的IincKA) =0。ind(A)表示基于集合A条件下的决策熵。
[0064] S32 :构建子编码集合IU1U2U3……}的条件属性等价关系集。并由此计算获得分类 集合簇元素 Hll j, I < i,j < Θ。Θ为为集合簇元素的二维坐标端点。
[0065] S33 :构造可辨识差别矩阵:由分类集合簇元素 Hilj构建可辨识差别矩阵
[0066] Md(i,j) = Im1),所述可辨识差别矩阵%(1,j)为Θ阶方阵,其具体结构如下:
[0068] 求解可辨识差别矩阵Md (i,j)的最小不可约简核core ()。
[0069] 其中,求解的方式简单表述如下:
[0070] 对于所有m u eM d (i,j) For(?=0;i< Θ ;i++) {for(j=0;j< Θ ;j++) {if| m g |=1, core( )= core( A) .U {m u}} //对高维属性集 合布尔量化处理,满足条件的m u即构成core ()的元素。
[0071] S34 :判断可辨识差别矩阵Md(i,j)的秩是否为空:
[0072] 若为空,则删除可辨识矩阵Md(i,j)的差别属性项后,求解维度最简的约简集,获 得约简差别属性集合。
[0073] 若不为空,则直接求解维度最简的约简集,获得约简差别属性集合。
[0074] 具体的求解方法简介如下:
[0076] 求解维度最简的约简集
[0077] Do red (A) = red (A) U ImijI
[0078] While (red(A) e U ieMd(lj j))〇
[0079] S35 :对约简差别属性集合差别属性进行不一致判断:
[0080] 用抽样未使用到的剩余对象做分类不一致性判断,即使用步骤S34中可辨识差别 矩阵中差别属性集合的补集元素,做分类不一致性判断:"
[0081] 若分类不一致的对象数量不小于基于动态反馈的阈值参数j,返回步骤S33,动态 调整中的阈值大小。
[0082] 若分类不一致的对象数量小于基于动态反馈的阈值参数j,则将维度最简的约简 集作为结果输出。
[0083] 具体的求解方法简介如下:
[0084] {If CountO < μ,Print(red(A)),β++}//如果分类不一致的对象数量小于基 于动态反馈的阈值参数j,则满足要求将该约简集输出,否则需要动态调整阈值的大小。
[0085] Return stepS33 (即返回步骤 S33)。
[0086] 参见图5,步骤4具体按如下步骤进行:
[0087] 由步骤3的结果分别计算获得标注词横向节点属性、标注词纵向节点深度属性: S41 :对维度最简的约简集进行语义标注词集合处理,所述语义标注词集合是对图像特征标 准化描述。
[0088] 基于标注词横向节点属性,计算图像间语义距离并作加和。
[0089] 通过计算一对标注词节点所包含的共有属性量和差异属性量,衡量标注词间的语 义距离,语义距离与共有属性成线性正相关,和差异属性成线性负
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1