一种面向本体中分类关系的语义评测方法

文档序号:6352714阅读:187来源:国知局
专利名称:一种面向本体中分类关系的语义评测方法
技术领域
本发明涉及自然语言处理(NLP)的技术领域,具体说是将语义相似度应用到对本体中分类关系的一致性评测和冗余性评测中的方法。更具体地,本发明涉及一种面向本体中分类关系的语义测评控制方法以及相应的控制系统。
背景技术
在语义web中,信息是以结构化的形式表示的,而本体(Ontology)则描述了其中的语义。作为语义web的一个研究方面,本体的作用和重要性被不断地开发出来。本体也越来越广泛地被应用到很多领域,如信息检索、机器翻译、知识管理、电子商务和信息集成等。 随着本体的数量和规模的不断增加,面对众多本体,一方面,用户需要有一个合适的评估方法来决定哪一个最适合;另一方面,本体构建者需要一种方法来评估所构建的本体中存在的各种问题,并在后续的本体构建活动中避免类似问题出现;第三,自动化(或半自动化)本体学习也需要有效地评估方法以选择“最好”的本体并选择相关学习算法中可调参数的值, 或指引学习过程本身;第四,已经构建好的本体也存在着本体管理、评测和维护等需求。于是随着对本体研究的深入,本体评测研究日益受到广泛关注。自20世纪90年代以来,国际上针对基于本体的相关系统的研究和开发日益受到学术界和业界的关注,围绕本体召开了为数众多的专题研讨会。例如,W3C(World Wide Web Consortium,万维网联盟)组为此成立了专门的工作组来推动语义Web技术及本体的发展; 美国马里兰大学(UMBC)在本体研究方面取得了多项成果,不仅研发了 SHOE (Simple HTML Ontology Extensions)本体语言和基于Java的开源OWL本体浏览器与编辑器Swoop,而且还开发了基于OWLDL推理机的Pel let推理机。基因本体协会(Gene Ontology Consortium) 则关注本体在基因工程中的研究和应用。还有一些著名国际会议例如德国卡尔斯鲁厄大学研究所AIFB组织的EON会议和生物医学国际会议(ICBO)等等。但作为本体研究的一个重要方面,本体评测到目前为止还处于探索阶段。虽然现在已有几种典型的本体评测方法,例如Ontometri、自然语言应用标准、OntoClean及ODEval方法等,但还缺少相关理论系统支持和公认的统一评测方法。近年来,本体作为一种能在语义层面上描述信息和数据的概念模型,被广泛地应用到知识表述、知识整合以及知识智能化等等领域中。然而大多数的本体都是由个人或专家为了一些专门的目的而建立起来的,这使得本体的互操作性变得很难。自90年代初期起,开始的本体评测研究随着信息技术的知识化和智能化发展趋势而显得日益重要。本体的评测工作可以从两个层面开展例如,对本体中词汇层面的评测,存在不少典型的评测方法;对本体中概念的关系评测,采用形式化的方法等。但现有的方法缺乏对本体中分类关系的整体评测,和对本体中分类关系语义层面的评测。本发明的目的至少在于对上述问题进行改进
发明内容
本发明提出一种新的本体中分类关系的评测方法。针对本体中分类关系的上下位关系和概念对划分关系,提出将语义相似度应用到对本体中分类关系的一致性评测和冗余性评测中。针对一致性评测,可以判定本体中存在的成环现象和语义问题,以及概念对的划分问题。针对现有技术中的缺陷,本发明的目的是提供一种面向本体中分类关系的语义测评控制方法的控制方法以及相应的控制系统。根据本发明的一个方面,提供一种面向本体中分类关系的语义测评控制方法,其用于对待测评本体中的分类关系进行测评,其包括如下步骤
a.对所述待测评本体进行预处理;
b.测评所述待测评本体中成环错误;
c.测评所述待测评本体中语义不一致错误;
d.测评所述待测评本体中分类关系的划分错误;
e.检测所述待测评本体中分类关系的相似概念错误;
f.检测待测评本体中分类关系的语法冗余错误;
g.根据上述五种错误计算获得所述待测评本体中分类关系的评测结果,并出具本体评测报告,其中,所述本体评测报告中对上述五种错误进行记录和定位。优选地,上述控制方法还可以通过如下步骤实现
第一步本体预处理,即输入待评测本体的OWL描述,抽取其中的分类关系,形成待评测本体的分类关系结构图。第二步运行本体中分类关系一致性评测模块,即分别使用成环检测功能、上下位分析功能和子类划分分析功能分别评测待评测本体中分类关系存在的成环错误,语义不一致错误和本体分类关系的划分错误。第三步运行本体中分类关系冗余性评测模块,即分别使用相似概念检测功能和同义路径检测功能分析待评测本体中分类关系存在的相似概念错误和语法上的冗余错误。第四步制定待评测本体中分类关系的TER评测报告。此报告包含着待评测本体中分类关系的评测结果和错误定位报告。根据本发明的另一个方面,还提供一种一种在信息检索、机器翻译、知识管理系统中用于对所使用的本体中分类关系进行语义测评的计算系统,其特征在于,根据上述控制方法实现对本体中分类关系的语义测评。与背景技术相比,本发明主要有以下优点
(I)全面评测了本体中的分类关系本方法能分析出本体分类关系中存在的不一致问题和冗余问题,并能准确地定位引发这些问题的相关分类关系。此外,本方法能定位出的错误概念和关系列表,经人工修改后,可以继续用本方法进行评测,如此迭代,直到没有找到新的概念或关系错误为止,即得到一个一致且简洁的本体。(2)全面考虑了本体中概念的语义特征在评价本体中分类关系时,本方法考虑了本体中的概念语义特征,并将语义相似性的测度方法用到本体中分类关系评价中,能有效地发现不一致问题和冗余问题。(3)生成待评测本体的评测报告;本方法所提出的本体评测方法,将待评测本体中分类关系存在的不一致问题和冗余问题以报告的形式展现,以方便本体工程师进行进一步修改和操作。


通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、 目的和优点将会变得更明显
图I示出根据本发明的第一实施例的,面向本体中分类关系的语义测评控制方法的流程图2示出根据本发明的第二实施例的,面向本体中分类关系的语义测评控制系统的示意图3示出根据本发明的第三实施例的,在面向本体中分类关系的语义测评控制方法中的本体的OWL描述文件的示意图;以及
图4示出根据本发明的第三实施例的,在面向本体中分类关系的语义测评控制方法中的本体的分类结构树的示意图。
具体实施例方式本发明提出的一种面向本体中分类关系的语义评测方法包括如下步骤首先对待评测本体进行预处理;然后运行本体中分类关系一致性评测模块和运行本体中分类关系冗余性评测模块;最后给出待评测本体中分类关系的TER (Taxonomy Evaluation Report)评测报告,该报告中包含着被评测本体中分类关系的评测结果和错误定位报告。图I示出根据本发明的第一实施例的,面向本体中分类关系的语义测评控制方法的流程图。首先执行步骤SlOl :对所述待测评本体进行预处理。本领域技术人员理解,本步骤中的预处理用于为后续步骤提供可以被处理的元素,优选地,建立待测评本体的分类关系结构图,例如图4所示,在此不予赘述。进一步地,本领域技术人员理解,优选地,通过第三方系统获得针对所述待测评本体的OWL描述,并抽取其中的分类关系,从而形成所述分类关系结构图。例如,该第三方系统用于存储所偶待测评本体的OWL描述,并根据本发明提供的控制系统的请求信息确定所述待测评本体的OWL描述并返回给本发明提供的控制系统,从而使得所述控制系统可以根据现有技术来抽取分类关系。本领域技术人员结合现有技术可以实现所述本步骤,在此不予赘述。其次进入步骤S102 :测评所述待测评本体中成环错误;
然后执行步骤S103 :测评所述待测评本体中语义不一致错误;
接下来进入步骤S104 :测评所述待测评本体中分类关系的划分错误;
然后进入步骤S105 :检测所述待测评本体中分类关系的相似概念错误;
然后进入步骤S106 :检测待测评本体中分类关系的语法冗余错误;
最后执行步骤S107 :根据上述五种错误计算获得所述待测评本体中分类关系的评测结果,并出具本体评测报告,其中,所述本体评测报告中对上述五种错误进行记录和定位。 本领域技术人员理解,通过不同的方式可以实现不同的测评结果,例如优选地,根据本实施例所获得本体中分类关系评测报告如下表所示
权利要求
1.一种面向本体中分类关系的语义评测方法,其用于对待测评本体中的分类关系进行测评,其特征在于,包括如下步骤a.对所述待测评本体进行预处理;b.测评所述待测评本体中成环错误;c.测评所述待测评本体中语义不一致错误;d.测评所述待测评本体中分类关系的划分错误;e.检测所述待测评本体中分类关系的相似概念错误;f.检测待测评本体中分类关系的语法冗余错误;g.根据上述五种错误计算获得所述待测评本体中分类关系的评测结果,并出具本体评测报告,其中,所述本体评测报告中对上述五种错误进行记录和定位。
2.根据权利要求I所述的控制方法,其特征在于,所述步骤a包括如下步骤 al.确定所述待测评本体的OWL描述;a2.抽取出所述OWL描述中的分类关系;a3.构造所述待评测本体的分类关系结构图;以及a4.运用深度优先遍历算法和广度优先遍历算法遍历所构造的待评测本体的分类关系结构图。
3.根据权利要求I或2所述的控制方法,其特征在于,所述步骤b包括如下步骤 bl.通过成环检测方法测评所述待测评本体中存在的成环错误;b2.将发生错误的概念对记录到待评测本体的测评报告中。
4.根据权利要求I至3中任一项所述的控制方法,其中,所述步骤c包括如下步骤 Cl.通过上下位分析的方法测评所述待测评本体中存在的语义不一致错误;c2.将发生错误的概念对记录到待评测本体的测评报告中。
5.根据权利要求I至4中任一项所述的控制方法,其中,所述步骤d包括如下步骤 dl.通过子类划分分析方法测评所述待测评本体中存在的分类关系划分错误;d2.将发生错误的概念对记录到待评测本体的测评报告中。
6.根据权利要求I至5中任一项所述的控制方法,其中,所述步骤e包括如下步骤 el.通过相似概念检测方法确定所述待测评本体中存在的相似概念错误;e2.将发生错误的概念对记录到待评测本体的测评报告中。
7.根据权利要求I至6中任一项所述的控制方法,其中,所述步骤f包括如下步骤 fl.通过同义路径检测方法确定所述待测评本体中存在的语法冗余错误;f2.将发生错误的概念对记录到待评测本体的测评报告中。
8.根据权利要求I至7中任一项所述的控制方法,其中,所述步骤g包括如下步骤 gl.输出所述待测评本体的测评报告。
9.一种在信息检索、机器翻译、知识管理系统中用于对所使用的本体中分类关系进行语义评测的计算系统,其特征在于,根据上述权利要求I至8中任一项所述的控制方法实现对本体中分类关系的语义测评。
全文摘要
本发明提供了一种面向本体中分类关系的语义评测控制方法,其用于对待测评本体中的分类关系进行测评,其包括如下步骤a.对所述待测评本体进行预处理;b.测评所述待测评本体中成环错误;c.测评所述待测评本体中语义不一致错误;d.测评所述待测评本体中分类关系的划分错误;e.检测所述待测评本体中分类关系的相似概念错误;f.检测待测评本体中分类关系的语法冗余错误;g.根据上述五种错误计算获得所述待测评本体中分类关系的评测结果,并出具本体评测报告。本发明主要有以下优点(1)全面评测了本体中的分类关系;(2)全面考虑了本体中概念的语义特征;(3)生成待评测本体的评测报告。
文档编号G06F17/30GK102609411SQ20111000295
公开日2012年7月25日 申请日期2011年1月9日 优先权日2011年1月9日
发明者俞云飞, 吕钊, 曹艳娇, 李琴, 梁璐 申请人:华东师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1