基于本体的智能语义文献检索推理系统的制作方法

文档序号:6380790阅读:128来源:国知局
专利名称:基于本体的智能语义文献检索推理系统的制作方法
技术领域
本发明属于数据智能处理分析技术领域,具体涉及一种基于本体的智能语义文献检索推理系统。
背景技术
传统的搜索不够智能,机器不能理解人类的语言,人机之间的交流困难,从而导致搜索出的信息不够准确。比如说烟灰色的水墨画,结果却是一个烟灰缸,等等。语义的搜索引擎,更加的智能化,可以给每个信息实例加上各式各样的标签,并读懂关键字之间的逻辑关系,大大增加了检索效率,但是目前语义的研究才处于起步阶段,各种技术都不是很成
熟。 本体是一种知识库对领域事物的描述,带有语义性,可以说是另一种数据库。本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。总的来说,构造本体可以实现某种程度的知识共享和重用,以及提高系统通讯、互操作、可靠性的能力。数据的含义就是语义。简单的说,数据就是符号。数据本身没有任何意义,只有被赋予含义的数据才能够被使用,这时候数据就转化为了信息,而数据的含义就是语义。语义具有领域性特征,不属于任何领域的语义是不存在的。而语义异构则是指对同一事物在解释上所存在差异,也就体现为同一事物在不同领域中理解的不同。对于计算机科学来说,语义一般是指用户对于那些用来描述现实世界的计算机表示(即符号)的解释,也就是用户用来联系计算机表示和现实世界的途径。语义是对数据符号的解释,而语法则是对于这些符号之间的组织规则和结构关系的定义。对于信息集成领域来说,数据往往是通过模式(对于模式不存在或者隐含的非结构化和半结构化数据,往往需要在集成前定义出它们的模式)来组织的,数据的访问也是通过作用于模式来获得的,这时语义就是指模式元素(例如类、属性、约束等等)的含义,而语法则是模式元素的结构。语义网是Semantic Web的中文名称。语义网就是能够根据语义进行判断的网络。简单地说,语义网是一种能理解人类语言的智能网络,它不但能够理解人类的语言,而且还可以使人与电脑之间的交流变得像人与人之间交流一样轻松。现有技术中对检索的个性化服务要求更多,而基于本体的语义检索大多停留在理论研究,真正实例很少。本发明因此而来。

发明内容
本发明目的在于提供一种基于本体的智能语义文献检索推理系统,解决了现有技术中海量数据进行搜索时,会耗费大量的时间等问题。为了解决现有技术中的这些问题,本发明提供的技术方案是一种基于本体的智能语义文献检索推理系统,其特征在于所述系统包括
本体库,所述本体库构建有文献领域内关于文献的知识内容;规则库,采用规则获得关于文献新的属性与原有属性的逻辑关系;显示界面,用于提示用户进行输入操作,并将检索推理结果展示给用户。优选的,所述本体库包括文章、作者、出版社本体;本体的数据类型包括内容、标题、关键字,本体的对象属性包括引用,被引用属性。优选的,所述规则库是对本体的对象属性规则的描述和说明,所加载的规则推理机为Reasoner推理机。本发明的另一目的在于提供一种采用所述的智能语义文献检索推理系统进行展示的方法,其特征在于所述方法包括以下步骤

(2)用户在显示界面上输入需要检索的关键词,并进行检索查询;(3)权利要求I所述的智能语义文献检索推理系统导入规则库,将与关键词相关的语义检索结果检索出来,并通过显示界面展示给用户。本发明与现有技术相比,具有如下的有益效果本发明技术方案通过对本体库的建立,加载规则推理机,对文献相关信息进行查询检索,通过查询结果的综合,将与此文献相关的信息——共同引用了同一篇文献、被一篇文献引用等信息推荐给用户,可以避免用户常规检索的结果繁杂,难以获得有用的信息。


下面结合附图及实施例对本发明作进一步描述图I为本发明技术方案采用所述的智能语义文献检索推理系统进行展示的方法流程图;图2为本发明技术方案中智能语义检索推理系统本体库的框架结构图;图3为本发明技术方案中智能语义检索推理系统本体库的另一框架结构图;图4为本发明技术方案中智能语义检索推理系统本体库中各文献之间的相互引用关系。图5为现有技术中旧模式下的文献检索展示的方法流程图。
具体实施例方式以下结合具体实施例对上述方案做进一步说明。应理解,这些实施例是用于说明本发明而不限于限制本发明的范围。实施例中采用的实施条件可以根据具体厂家的条件做进一步调整,未注明的实施条件通常为常规实验中的条件。实施例本实施例以图书馆文献系统为例,建立文献的知识领域模型。对这种个性化的基于本体的智能搜索进行探索,通过构建本体知识库,编写规则,实现语义检索,探索用户选择搜索规则的可行性。本实施例的智能语义检索推理系统主要分三个模块本体库、规则库、显示界面,以下具体介绍每个模块的具体功能(I)本体库
通过查阅文献,与专家沟通,确定文献的知识领域。利用对对文献领域知识的理解,确定该领域内共同认可的属性,并从不同层次的形式化模式上给出这些词汇,术语和词汇间相互关系的明确定义。在这种基础上,构建了文献的只是库,包括Class :文章、作者、出版社!Datatype属性内容、标题、关键字;0bject属性引用,被引用等;类的实例:文章、作者、出版社..。本体库构建了 Class、Datatype属性、Object属性之间的相互关系,比如作者jack对应了一篇文献articlel,属于Sci出版社(class),此文献有内容、关键字、标题等(datatype 属性),并且引用了 article3 和 article4,被 article5 引用(object 属性)。本体库实际上就是一个知识领域,反映了在这个领域中各种实体与属性之间的复杂关系。
(2)规则库创建Object新属性被同时引用,同时引用,并构建规则库,构建新建属性与之前属性的逻辑关系,利用规则,推理出各实例之间新的属性关系。这是本发明所用到的推理规则I) [bothCiting:( a http://www. domain2. com#Citing c),( b http://www. domain2. com#Citing c),notEqual ( a, b)->( a http://www. domain2. com#bothCiting b)]//a引用c,b也引用c,且a、b不相等,则推出他们具有同时引用的关系a#bothCiting b。2) [bothCited:( a http://www. domain2. com#Citing b),( a http://www. domain2. com#Citing c),notEqual ( b, c)->( b http://www. domain2. com#bothCited c)]//a引用b,a也引用c,且b、c不相等,则推出他们具有同时被引用的关系,b#bothCited C。(3)显示界面利用j2ee技术,tomcat作为服务器,利用网页作为本发明的项目结果显示界面。主界面是一个检索界面,包含检索项和检索值,可以选择标题、关键字、作者,进行检索;检索之后,点击搜索结果,可以查看文献详情,会显示编号、标题、关键字、作者、文献出处,内容,引用文献列表,被引用文献列表,同时引用文献列表、被同时引用文献列表。每一篇文献也对链接着它的详细信息。其中本体库建立文献知识领域模型,规则库制定不同的推理规则,各模块耦合度很低,扩展性强,充分体现了基与本体的语义技术的优势。首先,提出本体概念的目标是通过本体捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇,术语和词汇间相互关系的明确定义。这是基于本体的智能语义检索推理系统技术的最核心环节。本实施例正是在这种基础上,提出了文献的知识领域,包括Class:文章、作者、出版社!Datatype属性内容、标题、关键字;0bject属性引用,被引用等;类的实例文章(5篇)、作者(3人)、出版社(I家),如图3所示..构建了文献的本体库,创建Object属性被同时引用,同时引用,并构建规则库,推理出各实例之间新的属性关系,如图21所示。本实施例所用的编辑本体的工具是Prot6g63. 4. 7,Protege提供了本体概念类,关系,属性和实例的构建,并且屏蔽了具体的本体描述语言,用户只需在概念层次上进行领域本体模型的构建。图4为各文献之间的相互引用关系。构建推理规则,即当a引用c, b引用c,且a不等于b时,贝丨J a、bbothciting ;当 a引用b, b引用c,且b不等于c时,则b、c bothcited。每篇文献都有它的引用文献,也知道它被谁引用,那么在本体库中本实施例构建了 5篇文章的实例,并将其各种属性和各实例间关联一一对应;定义推理规则,如果一篇文章和另外一篇文章同时被第三者引用,则称他们为bothcited,如果这篇文章和另外一篇文章同时引用了第三篇文章,则称他们为bothciting。这样我们通过citing、cited、各实例间关联以及定义的规则,就可推出我们每篇文章的bothcited、bothciting属性,如表1、2所示。即验证了自定义规则的正确性与可行性。本实施例还可以编辑规则库,将规则选择权交给用户,用户就可以按照自己喜好选择自己希望的搜索方式。表I为规则I的查询结果(手动推理结果)表I规则I的手动推理结果
NOIN02N03N04NOS
Bothcitin Νθ ' Ν01、N03 NOl、N02 X03
Bothcited N02 : NOl :NOl : NOl :
Ν04、NO^ Ν04 ΝΟ Ν02、N05 Ν02、Ν04表2为规则I的查询结果(机器推理结果)
Articlel: BothcitingArticlelArticle_3
BothcitedArticle—2 Article_4 Article_5
Article_2: BothcitingArticlel Article_3
BothcitedArticlel Article_4 Article_5
Article_3: BothcitingArticlel Article_权利要求
1.一种基于本体的智能语义文献检索推理系统,其特征在于所述系统包括 本体库,所述本体库构建有文献领域内关于文献的知识内容; 规则库,采用规则获得关于文献新的属性与原有属性的逻辑关系; 显示界面,用于提示用户进行输入操作,并将检索推理结果展示给用户。
2.根据权利要求I所述的基于本体的智能语义文献检索推理系统,其特征在于所述本体库包括文章、作者、出版社本体;本体的数据类型包括内容、标题、关键字,本体的对象属性包括引用,被引用属性。
3.根据权利要求I所述的基于本体的智能语义文献检索推理系统,其特征在于所述规则库是对本体的对象属性规则的描述和说明,所加载的规则推理机为Reasoner推理机。
4.一种采用权利要求I所述的智能语义文献检索推理系统进行展示的方法,其特征在于所述方法包括以下步骤 (O构建权利要求I所述的智能语义文献检索推理系统; (2)用户在显示界面上输入需要检索的关键词,并进行检索查询; (3)权利要求I所述的智能语义文献检索推理系统导入规则库,将与关键词相关的语义检索结果检索出来,并通过显示界面展示给用户。
全文摘要
本发明公开了一种基于本体的智能语义文献检索推理系统,其特征在于所述系统包括本体库,所述本体库构建有文献领域内关于文献的知识内容;规则库,采用规则获得关于文献新的属性与原有属性的逻辑关系;显示界面,用于提示用户进行输入操作,并将检索推理结果展示给用户。该系统可以避免用户常规检索的结果繁杂,难以获得有用的信息。
文档编号G06F17/30GK102930030SQ201210441440
公开日2013年2月13日 申请日期2012年11月8日 优先权日2012年11月8日
发明者陈国庆, 周礼仁 申请人:苏州两江科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1