一种基于场论的本体中概念相似度计算方法

文档序号:6627977阅读:254来源:国知局
一种基于场论的本体中概念相似度计算方法
【专利摘要】本发明提供了一种基于场论的本体中概念相似度计算方法,基于场论,采用场的特性描述本体,把本体定义的语义结构转化为语义场以构建语义场模型;对本体包含的概念间语义关系进行规范化;本体利用信息量对概念的特征进行描述,得到概念的语义引力元和语义距离;最后应用所述语义场模型得到概念相似度。本发明全面考虑了概念相似与差异两方面对概念相似度计算的影响,改进了现有方法孤立考虑两者之一的缺陷。
【专利说明】一种基于场论的本体中概念相似度计算方法

【技术领域】
[0001] 本发明属于检索【技术领域】,尤其涉及一种基于场论的本体中概念相似度计算方 法。

【背景技术】
[0002] 利用关键字的检索从字符的表现形式上进行匹配,只能检索用户所表达的显性信 息,无法对用户表示的隐性信息进行处理。语言学的分类结构就可以很好的解决这一问题, 而语言学分类结构的一个应用最广泛的应用就是本体。本体就可以通过概念及概念间的关 系,有效地理解用户输入的信息,从而达到语义检索的目的。这一过程中最核心的步骤就是 依据本体中概念相似度对用户输入概念进行拓展。
[0003] 本体中概念相似度的计算方式主要分为两种,分别是基于概念间关系的边方法和 基于节点的方法,基于节点的方法又可以分为基于节点信息量的方法和基于节点的特征的 方法。
[0004] 以上两种类型的方法,都只考虑了概念相似度的一种角度。节点的方法从概念相 同的部分去分析概念的相似度,边的方法从概念差异的角度衡量相似度,两种方法都没有 综合考虑概念中相同和差异部分对相似度的影响。使用边的方法时,主要是采用权重衡量 概念的差异,主要由密度权重、深度(层次)权重、类型权重、信息量权重,前三种权重因子 不能准确的反映关系所连接概念的实际差异,并且这四类权值差异的根本原因在于本体内 概念信息量的分布。所以,无论是边方法还是节点的方法,都依据不同概念的信息量之间的 关系。综合考虑概念共享和差异的信息量,就能准确的得到概念的相似度。
[0005]以本体中某一概念为参考点,其他概念依据与该概念信息量中的差异得到与参考 点的距离,分布在以参考点为原点的一维空间中。当分别以本体内每一概念为参考点后,既 可以把本体中的概念分布在一个N维空间内,N为本体中概念的数量,进而得到任意两概念 的几何距离。


【发明内容】

[0006] 本发明的目的在于提供一种基于场论的本体中概念相似度计算方法,旨在解决现 有基于本体语义分析中的对概念特征描述不完整和对关系的作用描述不准确的问题。
[0007] 本发明是这样实现的,一种基于场论的本体中概念相似度计算方法,包括以下步 骤:
[0008] S1、基于场论,采用场的特性描述本体,把本体定义的语义结构转化为语义场以构 建语义场模型;
[0009] S2、对本体包含的概念间语义关系进行规范化;
[0010]S3、本体利用信息量对概念的特征进行描述,得到概念的语义引力元和语义距 离;
[0011] S4、应用所述语义场模型得到概念相似度。
[0012] 优选地,在步骤si中,所述语义场模型用函数定义为:
[0013]

【权利要求】
1. 一种基于场论的本体中概念相似度计算方法,其特征在于,包括以下步骤: 51、 基于场论,采用场的特性描述本体,把本体定义的语义结构转化为语义场以构建语 义场模型; 52、 对本体包含的概念间语义关系进行规范化; 53、 本体利用信息量对概念的特征进行描述,得到概念的语义引力元和语义距离; 54、 应用所述语义场模型得到概念相似度。
2. 如权利要求1所述的基于场论的本体中概念相似度计算方法,其特征在于,在步骤 S1中,所述语义场模型用函数定义为: ^ _ fxm(cjxm(c2} t* 一 z · 式中,nKcJ、m(c2)为概念的引力兀,对于语义场,引力兀;r为概念间 的语义距离,f为引力常数。
3. 如权利要求1所述的基于场论的本体中概念相似度计算方法,其特征在于,在步骤 S2中,所述语义关系包括上下位关系、等同关系、与关系和交叉关系、或关系、非关系、矛盾 关系和互补关系。
4. 如权利要求1所述的基于场论的本体中概念相似度计算方法,其特征在于,在步骤 S3中,所述信息量为根据某一概念的父类和子类的信息量共同决定,且用概念在本体中发 生的频数来表示。
【文档编号】G06F17/30GK104239546SQ201410490635
【公开日】2014年12月24日 申请日期:2014年9月23日 优先权日:2014年9月23日
【发明者】王国新, 王祎楠, 阎艳, 师鑫 申请人:北京理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1