一种构造rest风格的本体标注可视化系统的方法

文档序号:6639069阅读:132来源:国知局
一种构造rest风格的本体标注可视化系统的方法
【专利摘要】本发明涉及一种构造REST风格的本体标注可视化系统的方法,该方法包括:S100系统处理以本体作为处理的基本对象,使得机器明白数据本身的逻辑含义;S200利用关系数据库来持久存储解析后的本体数据,以便能快速、便捷地访问、操作本体数据;S300利用本体数据对获取的信息进行REST风格服务的自动语义标注,以对REST风格中的服务进行扩展,提取本体数据;S400将本体可视化呈现,提供针对一般用户与专家用户的不同策略;S500采用REST架构风格建立支持异构的、跨浏览器平台的本体可视化的Web工程,使用户能方便地访问、服务器能更高效地工作。本发明在可视化以及Web服务层面:将这些实现在基于rest架构风格的Web工程中,嵌入本体可视化技术,达到方便查看的目的。
【专利说明】一种构造 REST风格的本体标注可视化系统的方法

【技术领域】
[0001] 本发明涉及本体标注可视化系统,具体地指一种构造 REST风格的本体标注可视 化系统的方法。

【背景技术】
[0002] 1993年,美国斯坦福大学的Gruber定义了本体,即"概念模型的明确的规范说"。 在信息科学领域,这个定义已经得到了广泛采纳和认可。简要的说,本体就是将特定领域知 识概括为概念模型去描述概念之间的差别、关系和约束。
[0003] 但是,现有技术在构建一个本体标注可视化系统时,存在以下问题:在本体数据层 面有些本体的数据是固定的,不能动态变化;在本体验证层面:大部分本体都没有经过验 证,不能证明其完整性合理性;在本体可视化层面,一般只提供一种基于Prefuse用户信息 展示,不能满足专业人士的操作需求。
[0004] 此外,根据当前语义标注的的研究现状和比较分析当前的语义标注工具,现在的 语义标注工具仍然不能满足要求,存在着以下不足:
[0005] (1)大多数的标注工具都需要通过手工操作来实现,少部分的支持半自动化标注, 并且自动化精确度还不高;
[0006] (2)绝大多数的支持DAML、RDFS、0IL,支持OWL语言的标注工具比较少;
[0007] (3)工具的标注对象有网页、图片等,且以静态形式为主,而Web存在着很多动态 内容,如企业级应用中的业务数据等。
[0008] 而在本体可视化中,虽然已经有很多用来有效地呈现本体模型的工具,如基于 Prot6g6的可视化插件,如OWLViz、OntoViz等;以及具有强大的可视化功能和二次开发接 口的通用可视化工具,如Prefuse、Piccolo等。但是,基于插件的可视化工具在可视化的过 程中存在着一些缺陷和不足,如=OWLViz将图形堆叠在界面左上角、对中文本体图示布局 效果不明显、OntoViz生成中文本体图示效果较差等。


【发明内容】

[0009] 本发明目的在于克服上述现有技术的不足而提供一种构造 REST风格的本体标注 可视化系统的方法,该方法能够从不同角度对本体进行处理,达到本体的语义及内容的充 分理解,并结合Web进行呈现。
[0010] 实现本发明目的采用的技术方案是一种构造 REST风格的本体标注可视化系统的 方法,该方法包括:
[0011] S100、系统以本体作为处理的基本对象,由于本体所自带的语义信息,通过本体分 析工具解析,使得机器能明白数据本身的逻辑含义;
[0012] S200、利用关系数据库来持久存储解析后的本体数据,以便能快速、便捷地访问、 操作本体数据;
[0013] S300、利用本体数据对获取的信息进行REST风格服务的自动语义标注,以对REST 风格中的服务进行扩展,提取本体数据;
[0014] S400、将本体可视化呈现,提供针对一般用户与专家用户的不同策略;
[0015] S500、采用REST架构风格建立支持异构的、跨浏览器平台的本体可视化的Web工 程,使用户能方便地访问、服务器能更高效地工作。
[0016] 本发明在可视化以及Web服务层面:将这些实现在基于rest架构风格的Web工程 中,嵌入本体可视化技术,达到方便查看的目的。由于采用的是B/S模式,所以其能够跨浏 览器支持,具有较好的兼容性,并且提供了两种视图,为不同用户提供了不同服务。一种普 通用户视图,基于Prefuse,直观易懂,方便不熟悉本体领域的用户查看,另一种专家用户视 图,通过网页呈现所有的本体信息,方便专家探查本体。

【专利附图】

【附图说明】
[0017] 图1为Jena推理、解析本体模型的流程图。
[0018] 图2为Jena推理机制原理图。
[0019] 图3为本体知识库的总体设计E-R图。
[0020] 图4为REST风格式Web服务语义标注过程示意图。
[0021] 图5为基于REST风格Web服务标注流程示意图。
[0022] 图6-1为专家用户版的结构框图,图6-2为普通用户版的结构框图。
[0023] 图7为显示1级类的相关信息图。
[0024] 图8为显示知识点实例的相关信息图。
[0025] 图9-1为双击1显示所有2级标题的示意图;图9-2为双击I. 1.节显示所有的3 级标题的示意图;图9-3鼠标划过I. I. 1节时显示详细的信息的示意图。
[0026] 图10为结合了 Ajax技术的REST风格架构示意图。

【具体实施方式】
[0027] 下面结合附图和具体实施例对本发明作进一步的详细说明。
[0028] 本发明将本体化标注可视化系统嵌入REST风格的Web架构中,具体步骤如下:
[0029] S100、本体模型验证和解析
[0030] OWL是以RDF和RDFS为基础的一种人们更易读懂、但是不符合RDF惯例的基于XML 的语法,还提供了良好的语义表达和推理能力,在Web内容的机器可读性上,比RDF、RDFS等 语言等更好。
[0031] 在本发明中,数据资源层的基础是使用OWL语言来描述的领域本体,常用.owl文 件来保存。对.〇?1的有两个方面的操作,如图1所示,具体的流程为:
[0032] (1)使用Jena所提供的RDF API,并读取OWL文档即· owl文件来构建RDF模型, 将RDF模型结合Jena的本体子系统和推理子系统构建本体模型。其中通过Jena内部的推 理机制来检验已构建的本体模型是否具有正确性和完整性。
[0033] (2)可以使用RDQL去查询本体模型中的语义信息。为了实现本体模型的持久化 存储,使用Jena提供的推理子系统去抽取本体模型中所需的语义信息,并存入到关系数据 库。
[0034] S200、Jena推理机验证本体模型
[0035] 本体的构建工作大多是手工进行的,在这个过程中难免会出现疏漏和错误,通过 检验本体模型来发现一些错误并及时的将错误信息反馈给本体领域专家,为领域本体的逻 辑准确性提供了保证,并为后期的开发工作提供了结实的基础。所以在构建本体知识库之 前,必须要对领域本体模型进行验证。
[0036] I) Jena推理机原理
[0037] Jena推理机可用于本体模型的验证工作,下面简要的介绍一下其工作原理。
[0038] Jena的推理子系统将推理引擎或推理机移植到Jena内部,使用模型工厂将推理 机制和数据集关联起来。这些推理引擎或推理机是来自一些和本体相关的公理和规则推理 程序,主要用途是从现有的实例数据和类描述中推断出一些隐含的陈述。对已创建的模型 进行查询时,返回结果包括模型中的原始数据也包含额外的语句,这些语句是使用规则或 其他推理机制来获得的。推理机的总体结构如图2所示。
[0039] Jena主要有一个静态类推理机注册表。它主要用于注册新的推理机类型和动态搜 索特定类型的推理机。推理机注册表还提供了方便的访问预先构建的主要推理者提供的实 例。首先,根据三元组所描述的资源信息和本体内部包含的信息,推理机利用事前确定好的 相关规则去创建推理机。本体API提供了简单的方法将推理机和本体模型连接起来,然后 获得检索模型对象。最后,使用本体和模型API,结合推理概念来实现语义化信息的检索,获 得隐含的数据结果。
[0040] 2)本体模型验证工作
[0041] OWL提供了很多构词,如描述OWL类的构词有:简单类(Class),枚举类(oneOf), 属性约束类(valuesOf),以及丰富公理,描述类公理的构词有:子关系公理(subClassOf), 等价关系公理(equivalectClass),互斥关系公理(disjointWith)等。这都为本体的推理 提供了准备工作。在OWL语言结构的基础上,Jena内置的推理机Pellet提供了很多的推理 服务,如有本体的一致性检测、包含性检测、实例检测等。结合本体模型,其验证工作如下:
[0042] ①本体的一致性检测
[0043] 检测本体模型中,语义关系是否一致。如在定义类时,两个互斥关系的类,它们之 间的关系属性没有标识为disjointWith,而导致在后期的推理中引起了冲突,出现了本体 概念不一致的情况。
[0044] ②概念的包含性检测
[0045] 检测本体模型中,概念的包含关系是否正确。例如,两个具有disjointWith关系 的父类有同一个子类,这种包含关系是不允许的。
[0046] ③实例检测
[0047] 检测本体模型中,实例和类之间的关系是否正确。例如,如果存在一个实例属于两 个互斥的类,那么这样的关系是不正确的。
[0048] 以电子商务本体e-commerce, owl为例,制定了一些规则,下面是其中的三个:
[0049] 规则 1:
[0050]

【权利要求】
1. 一种构造REST风格的本体标注可视化系统的方法,其特征在于,包括: S100、系统W本体作为处理的基本对象,由于本体所自带的语义信息,通过本体分析工 具解析,使得机器能明白数据本身的逻辑含义; S200、利用关系数据库来持久存储解析后的本体数据,W便能快速、便捷地访问、操作 本体数据; 5300、 利用本体数据对获取的信息进行REST风格服务的自动语义标注,W对REST风格 中的服务进行扩展,提取本体数据; S400、将本体可视化呈现,提供针对一般用户与专家用户的不同策略; S500、采用REST架构风格建立支持异构的、跨浏览器平台的本体可视化的Web工程,使 用户能方便地访问、服务器能更高效地工作。
2. 根据权利要求1所述构造REST风格的本体标注可视化系统的方法,其特征在于所述 步骤S300中利用本体数据对获取的信息进行REST风格服务的自动语义标注,具体包括W 下步骤: 5301、 调用和注册;用户先输入某个Web应用,或所需服务的APIs,或者一个可用的 REST风格的服务U化,该些信息将作为服务U化S的一部分。系统将自动获得和每一个提到 的REST服务相关的信息,把REST风格服务调用转换为对一个具体服务的查询(具体的服 务请求中包含了 U化和相关的参数)。系统调用REST风格服务,并分析响应结果来获得参 数集的一个基本的语法表述; 5302、 依照语法结合输入输出参数去描述REST风格服务、确定关键词的集合;通过分 词、提取页面可能成为关键词的名词; 5303、 判断该些名词是否是简单类型的概念SC。如果是,则进入步骤S305 ;如果否,贝U 进入步骤S304 ; 5304、 该些名词是复合概念CC,对其进行分析和分解,将处理结果作为新的名词,转步 骤S303 W继续判断是否是简单类型的概念SC ; 5305、 将简单类型的概念SC与已经构建好的领域本体中的概念0C根据W下规则机制 进行匹配: Sim (1C, 0C) = ki*SimcN (1C, 0C) +k2*SimcA (1C, 0C) +k;3巧im。服(1C, 0C) 其中,Simew,Sim^,SimcKE分别为基于名称的相似度计算规则,基于属性的相似度计算规 则W及基于正则表达式的特征相似度计算规则; k(i,2,:3)是算法的权重。 5306、 如果匹配成功,则转步骤S308 ; 如果匹配不成功,且不超过匹配限定次数,则转步骤S307 ; 如果匹配不成功,且超过匹配限定次数,则结束; 5307、 根据拼写建议词库和同义词词库,找到类似的概念LS,并继续判断是否是简单概 念,转步骤S303 ; 5308、 根据SPAR化查询0C的语义信息,生成标注结果,结束。
3. 根据权利要求1所述构造REST风格的本体标注可视化系统的方法,其特征在于:所 述步骤S400中将本体可视化呈现,提供针对一般用户与专家用户的不同策略,具体包括W 下步骤: 5401、 针对专家用户的方案;将本体中的类、实例及实例的相关属性W本体的专用词汇 结合图片、视频、音频的可视化效果呈现给专家用户; 5402、 针对普通用户的方案:采用Pre化se可视化工具将本体中的概念及语义关系展 示给用户。
4.根据权利要求1所述构造REST风格的本体标注可视化系统的方法,其特征在于: W本体文件作为输入,通过对本体的验证、推理与解析,实现本体的持久化存储和语义标注 器;然后规划本体中的数据集合划分其中的资源,对资源进行规范的URI定义,并统一接 口;同时,结合自动化语义标注方法,实现基于REST风格的本体可视化Web服务的服务端。 所述步骤S500中,采用REST架构风格建立支持异构的、跨浏览器平台的本体可视化的Web 工程,使用户能方便地访问、服务器能更高效地工作,具体包括W下步骤: 5501、 划分资源和资源设计;在本体可视化的应用系统中,资源集包括类、实例、属性及 属性约束和属性特征; 5502、 REST风格接口的实现,REST统一风格接口使用HTTP协议标准方法来实现对各种 资源的请求操作,首先是将HTTP方法GET、POST、PUT和DELETE映射到REST接口中,然后去 调用对应资源类中的方法来操作资源,最后通过Ajax异步调用技术来实现客户端和服务 器端之间的异步通信。
【文档编号】G06F17/30GK104462460SQ201410784396
【公开日】2015年3月25日 申请日期:2014年12月16日 优先权日:2014年12月16日
【发明者】宋华珠, 钟珞, 刘翔, 肖聪, 夏红霞, 赵紫悦, 刘永坚 申请人:武汉理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1