一种半自动化学习式owl建模系统的制作方法

文档序号:6438028阅读:286来源:国知局
专利名称:一种半自动化学习式owl建模系统的制作方法
技术领域
本发明属于计算机技术领域,具体涉及一种OWL建模系统。
背景技术
今天,计算机已经深入人类社会的每个角落,而且可以预见其将在人类文明发展进程中扮演越来越重要的角色。让计算机理解人类的知识,从而更加智能化地服务于人类是未来发展的方向。为了实现这个目的,人们做了许多尝试,例如可以用知识结构重新构造互联网,即语义互联网,它主要采用W3C的互联网本体语言(Ontology of Web Language,简称0WL)建立语义网络。如果所有人都按OffL创建互联网,互联网本身就成为一个计算机可以在一定程度上“理解”的知识结构。在这个基础上软件工程师们可以为计算机设计一系列推理规则和引擎,在OWL语义网络上让计算机自己“理解”互联网信息内容, 并做出正确的判断和操作。OffL的构思代表了未来的发展方向,是对计算机能够读懂人类的知识的非常重要的尝试。沿这这个思路,我们可以构造计算机新的知识结构。它首先就需要解决的一个问题是对人类的知识进行建模,尤其是利用互联网的海量信息建立完善的CWL模型。这个过程应该是计算机自学习式的,同时又有人工处理的过程以进行适当的完善,只有这样才能避免巨大的人工工作量,同时为建立准确可靠的模型提供了可能。

发明内容
本发明提供了一种解决上述问题的方案,提供一种半自动化学习式、高效、准确的 OffL建模系统。基于以上思路,本发明的技术方案是提供一种半自动化学习式OWL建模系统,其特征在于其包括人工处理模块、倒排索引建库模块和CWL模型比较模块,其中
人工处理模块,以人工操作的方式建立OWL知识模型作为种子模型; 倒排索引建库模块,从互联网上采集信息并将其转换成OffL本体实例,提取该OffL本体实例的本体元,建立本体元的倒排索引数据库。本体元是最小的不可分解本体。倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置;
CWL模型比较模块,对种子模型和倒排索引数据库中的本体元进行比较,将属于同一知识领域的本体元的属性补充到种子模型中以完善种子模型。优选的,其还包括OWL本体模型库,用于存储所述人工处理模块建立的种子模型和所述倒排索引建库模块转换后的OWL本体实例。优选的,所述倒排索引建库模块包括以下模块
原始文档管理系统,负责通过搜索引擎从互联网采集各种信息;
OffL本体转换模块,负责将原始文档管理系统采集的信息转换成OWL本体实例,并存入OffL本体实例库;
提炼OWL本体元模块,提炼OWL本体实例库中所有OWL本体实例的本体元; 本体实例倒排索引模块,建立提炼OWL本体元模块获得的本体元的倒排索引,并存入所述倒排索引数据库。优选的,所述人工处理模块还包括辞典维护模块,负责建立并维护OffL本体辞典, 所述OWL本体转换模块根据所述OWL本体辞典将原始文档管理系统采集的信息转换成OWL 本体实例。优选的,所述人工处理模块还包括OWL兼容性规则人工维护模块,负责建立和维护OWL兼容性规则库,所述OWL模型比较模块根据所述OWL兼容性规则库中的OWL兼容性规则对所述种子模型和倒排索引数据库中的本体元进行比较。优选的,所述人工处理模块还包括疑难问题人工处理模块,负责处理所述OWL模型比较模块中的异常,并人工调整所述种子模型。本发明的一种半自动化学习式OffL建模系统是将人工干预和自动学习结合起来, 从而实现OWL建模时的自动化和精确性。为建立人类知识的计算机模型提供了一种极具操作性的解决思路。其具有高效、准确等优点。


图1是本发明的一种半自动化学习式OffL建模系统的原理框架图。
具体实施例方式下面对本发明的具体实施方式
作进一步详细的描述。如图1所示,本发明的一种半自动化学习式OffL建模系统有以下部分组成
1)原始文档管理系统从搜索引擎采集来的互联网原始信息;
2)OffL转换模块将原始文档管理系统提供的原始文档做OWL转换,并存入本体实例数据库;
3)提炼OffL本体元模块从本体实例库每一个本体实例中提取本体元(即最小的不可分解本体);
4)本体实例倒排索引模块完成对本体元的倒排索引,并存入本体元倒排索引库; 5XWL模型比较模块,以人工建造的OffL种子模型为基础,对本体元倒排索引表中的每
一个本体元进行比对,利用人工维护的兼容性规则判断哪些本体元属于种子模型的同一知识范畴,哪些需要向人工处理模块提问的,哪些与种子模型所涉及的知识无关。判断的标准分三个维度
a)定义(域)的判断和关系结构识别,即两个对比的概念是否同一类概念,如果是,则它们是什么关系,比如局部与整体、上下级、亲戚,等等;
b)属性的判断和排序,即两种属性是否属于同一范畴,如果是,要进行量化排序。比如颜色赤、橙、黄、绿、蓝、靛、紫;
c)行为特征判断和排序,即两种行为是否属于同类,如果是,要进行程度排序,比如 笑微笑、…大笑;
6)疑难问题人工处理模块受理CWL模型比较模块抛出的异常,人工调整模型;
47)模型比较的合理结果和人工干预的结果送到模型更新模块对种子模型进行修改、升级,存入CWL模型库;
8)兼容性规则模块负责人机交互,完成对兼容性规则的维护,结果存入兼容性规则
库;
9)OffL种子模型和OWL辞典库都是通过“OWL本体建模、辞典的人工维护”模块维护的, OffL知识模型和OWL辞典在OWL转换过程中也要用到。具体来说,本发明的一种半自动化学习式OffL建模系统的主流程如下
1、知识管理员通过人工建模工具建立某个知识领域的种子模型;
2、通过搜索引擎或其他信息采集手段获取知识信息,并存入原始文档管理系统;
3、系统对原始信息做OffL本体实例转换、本体元倒排索引,并存入本体元倒排索引表;
4、系统利用人工创建的种子模型与系统初步提炼的(存在倒排索引表中的)每一个本体元进行模型对比,在兼容性规则的帮助下,识别同类知识;
5、把符合“合理知识”标准的本体元直接输出给OWL模型更新模块,把有“疑问,,的知识提交人工处理模块,把无关的知识抛弃;
6、知识管理员根据系统的提问,对知识模型做适当的调整,并输出给CWL模型更新模
块;
7、CWL模型更新模块负责修改、升级种子模型;
8、不断重复步骤1到7,OffL知识模型就会越来越完善;
9、需要时,人工调整兼容性规则、OffL辞典库、甚至OWL模型本身。以上实施例仅为本发明其中的一种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说, 在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
权利要求
1.一种半自动化学习式OffL建模系统,其特征在于其包括人工处理模块、倒排索引建库模块和OWL模型比较模块,其中人工处理模块,以人工操作的方式建立OWL知识模型作为种子模型;倒排索引建库模块,从互联网上采集信息并将其转换成OWL本体实例,提取该OWL本体实例的本体元,建立本体元的倒排索引数据库;CWL模型比较模块,对种子模型和倒排索引数据库中的本体元进行比较,将属于同一知识领域的本体元的属性补充到种子模型中以完善种子模型。
2.根据权利要求1所述的一种半自动化学习式OffL建模系统,其特征在于其还包括 OffL本体模型库,用于存储所述人工处理模块建立的种子模型和所述倒排索引建库模块转换后的OWL本体实例。
3.根据权利要求1所述的一种半自动化学习式OffL建模系统,其特征在于所述倒排索引建库模块包括以下模块原始文档管理系统,负责通过搜索引擎从互联网采集各种信息;OffL本体转换模块,负责将原始文档管理系统采集的信息转换成OWL本体实例,并存入 OffL本体实例库;提炼OWL本体元模块,提炼OWL本体实例库中所有OWL本体实例的本体元;本体实例倒排索引模块,建立提炼OWL本体元模块获得的本体元的倒排索引,并存入所述倒排索引数据库。
4.根据权利要求3所述的一种半自动化学习式OffL建模系统,其特征在于所述人工处理模块还包括辞典维护模块,负责建立并维护OWL本体辞典,所述OWL本体转换模块根据所述OWL本体辞典将原始文档管理系统采集的信息转换成OWL本体实例。
5.根据权利要求1所述的一种半自动化学习式OWL建模系统,其特征在于所述人工处理模块还包括OWL兼容性规则人工维护模块,负责建立和维护OWL兼容性规则库,所述 OffL模型比较模块根据所述OWL兼容性规则库中的OWL兼容性规则对所述种子模型和倒排索引数据库中的本体元进行比较。
6.根据权利要求1所述的一种半自动化学习式OWL建模系统,其特征在于所述人工处理模块还包括疑难问题人工处理模块,负责处理所述OWL模型比较模块中的异常,并人工调整所述种子模型。
全文摘要
本发明公开了一种半自动化学习式OWL建模系统,其特征在于其包括人工处理模块、倒排索引建库模块和OWL模型比较模块,其中人工处理模块,以人工操作的方式建立OWL知识模型作为种子模型;倒排索引建库模块,从互联网上采集信息并将其转换成OWL本体实例,提取该OWL本体实例的本体元,建立本体元的倒排索引数据库;OWL模型比较模块,对种子模型和倒排索引数据库中的本体元进行比较,将属于同一知识领域的本体元的属性补充到种子模型中以完善种子模型。本发明的一种半自动化学习式OWL建模系统是将人工干预和自动学习结合起来,从而实现OWL建模时的自动化和精确性。为建立人类知识的计算机模型提供了一种极具操作性的解决思路。其具有高效、准确等优点。
文档编号G06F17/30GK102521241SQ201110357609
公开日2012年6月27日 申请日期2011年11月14日 优先权日2011年11月14日
发明者王楠 申请人:江苏联著实业有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1