领域本体的构建方法和装置的制造方法_3

文档序号:9765807阅读:来源:国知局
究领域,并在确定原始数据之后,对原始数据按照一 定的规则进行自动化清洗和整理,从而设计领域本体的框架,即将获得的原始数据进行一 定的格式处理,从而确定领域本体的大体框架。
[0076] 优选地,上述确定模块42实现的确定任意两个原始数据之间的关联关系的功能 可W通过如下功能模块来实现:检测模块421和定义模块423。
[0077] 其中,检测模块421,用于检测语义库中术语之间的关系;定义模块423,用于使用 语义库中术语之间的关系来定义任意两个原始数据之间的关联关系。
[0078] 本申请上述检测模块421和定义模块423提供方案,可W通过检测语义库中术语 间的关系(例如,定义概念及概念之间的关系),来确定任意两个原始数据之间的等同关 系、层级关系、相关关系等关联关系。
[0079] 优选地,上述生成模块44实现的使用本体编辑工具将多个原始数据W及原始数 据之间的关联关系按照示例本体文件进行编写,生成技术领域的领域本体的功能可W通过 如下功能模块来实现:创建模块441、子获取模块443和构建模块445。
[0080] 其中,创建模块441,用于创建示例本体文件;子获取模块443,用于获取领域本体 可识别的格式;构建模块445,用于通过本体编辑工具将多个原始数据W及原始数据之间 的关联关系按照领域本体可识别的格式读入示例本体文件,构建出技术领域的领域本体。
[0081] 本申请上述创建模块441、子获取模块443和构建模块445提供方案,可W实现通 过计算机仿照prot6g6文件的形式自动化写入本体的内容,构建出特定技术领域的本体。 W新能源汽车的领域为例,运种本体的形式化表示,通过借助prot6g6采用编程的方式对 准备好的原始数据进行编码,自动化构建出新能源汽车领域的本体。
[0082] 优选地,在生成模块44实现生成技术领域的领域本体之后,装置还可W包括如下 功能模块:处理模块46,用于使用本体编辑工具对领域本体进行检测和验证,其中,在检测 到领域本体需要进行进化的情况下,重新定义任意两个原始数据之间的关联关系,直到检 测到领域本体不需要进化的情况下,建立领域本体的本体文件。
[0083] 本申请上述优选方案,可W借助prot6g6对自动化构建的本体文件进行检测和验 证,进而实现对领域本体的确认与评价,针对提出的本体构建要求对构建出的领域本体进 行验证,评价其是否符合标准,并最终完成领域本体的建立,形成一个可被prot6g6识别并 读取的OWL文件,供后面的语义解析与推理使用。
[0084] 上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0085] 在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有 详述的部分,可W参见其他实施例的相关描述。
[0086] 在本申请所提供的几个实施例中,应该理解到,所掲露的客户端,可通过其它的方 式实现。其中,W上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻 辑功能划分,实际实现时可W有另外的划分方式,例如多个单元或组件可W结合或者可W 集成到另一个系统,或一些特征可W忽略,或不执行。另一点,所显示或讨论的相互之间的 禪合或直接禪合或通信连接可W是通过一些接口,单元或模块的间接禪合或通信连接,可 W是电性或其它的形式。
[0087] 作为分离部件说明的单元可W是或者也可W不是物理上分开的,作为单元显示的 部件可W是或者也可W不是物理单元,即可W位于一个地方,或者也可W分布到多个网络 单元上。可W根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0088] 另外,在本发明各个实施例中的各功能单元可W集成在一个处理单元中,也可W 是各个单元单独物理存在,也可W两个或两个W上单元集成在一个单元中。上述集成的单 元既可W采用硬件的形式实现,也可W采用软件功能单元的形式实现。
[0089] 所述集成的单元如果W软件功能单元的形式实现并作为独立的产品销售或使用 时,可W存储在一个计算机可读取存储介质中。基于运样的理解,本发明的技术方案本质上 或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可WW软件产品的形式 体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用W使得一台计算机 设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部 或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM, ReacHDnly Memcxry)、随机存 取存储器(RAM, Random Access Memory)、移动硬盘、磁碟或者光盘等各种可W存储程序代 码的介质。
[0090] W上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人 员来说,在不脱离本发明原理的前提下,还可W做出若干改进和润饰,运些改进和润饰也应 视为本发明的保护范围。
【主权项】
1. 一种领域本体的构建方法,其特征在于,包括: 获取任意一个技术领域的多个原始数据; 确定任意两个原始数据之间的关联关系,所述关联关系包括:等同关系、层级关系和相 关关系; 使用本体编辑工具将所述多个原始数据以及所述原始数据之间的关联关系按照示例 本体文件进行编写,生成所述技术领域的领域本体。2. 根据权利要求1所述的方法,其特征在于,从语义库中读取所述任意一个技术领域 的多个原始数据,并在所述获取任意一个技术领域的多个原始数据之后,对所述多个原始 数据进行分组和/或排序,得到所述技术领域的领域本体框架。3. 根据权利要求2所述的方法,其特征在于,确定任意两个原始数据之间的关联关系 的步骤包括: 检测所述语义库中术语之间的关系; 使用所述语义库中术语之间的关系来定义所述任意两个原始数据之间的关联关系。4. 根据权利要求3所述的方法,其特征在于,使用本体编辑工具将所述多个原始数据 以及所述原始数据之间的关联关系按照示例本体文件进行编写,生成所述技术领域的领域 本体的步骤包括: 创建所述示例本体文件; 获取所述领域本体可识别的格式; 通过所述本体编辑工具将所述多个原始数据以及所述原始数据之间的关联关系按照 所述领域本体可识别的格式读入所述示例本体文件,构建出所述技术领域的领域本体。5. 根据权利要求1-4中任意一项所述的方法,其特征在于,在生成所述技术领域的领 域本体之后,所述方法还包括:使用所述本体编辑工具对所述领域本体进行检测和验证,其 中,在检测到所述领域本体需要进行进化的情况下,重新定义任意两个原始数据之间的关 联关系,直到检测到所述领域本体不需要进化的情况下,建立所述领域本体的本体文件。6. -种领域本体的构建装置,其特征在于,包括: 获取模块,用于获取任意一个技术领域的多个原始数据; 确定模块,用于确定任意两个原始数据之间的关联关系,所述关联关系包括:等同关 系、层级关系和相关关系; 生成模块,用于使用本体编辑工具将所述多个原始数据以及所述原始数据之间的关联 关系按照示例本体文件进行编写,生成所述技术领域的领域本体。7. 根据权利要求6所述的装置,其特征在于,从语义库中读取所述任意一个技术领域 的多个原始数据,所述装置还包括:筛选模块,用于对所述多个原始数据进行分组和/或排 序,得到所述技术领域的领域本体框架。8. 根据权利要求7所述的装置,其特征在于,所述确定模块包括: 检测模块,用于检测所述语义库中术语之间的关系; 定义模块,用于使用所述语义库中术语之间的关系来定义所述任意两个原始数据之间 的关耳关关系。9. 根据权利要求8所述的装置,其特征在于,所述生成模块包括: 创建模块,用于创建所述示例本体文件; 子获取模块,用于获取所述领域本体可识别的格式; 构建模块,用于通过所述本体编辑工具将所述多个原始数据以及所述原始数据之间的 关联关系按照所述领域本体可识别的格式读入所述示例本体文件,构建出所述技术领域的 领域本体。10.根据权利要求6-9中任意一项所述的装置,其特征在于,所述装置还包括:处理模 块,用于使用所述本体编辑工具对所述领域本体进行检测和验证,其中,在检测到所述领域 本体需要进行进化的情况下,重新定义任意两个原始数据之间的关联关系,直到检测到所 述领域本体不需要进化的情况下,建立所述领域本体的本体文件。
【专利摘要】本发明公开了一种领域本体的构建方法和装置。其中,该方法包括:获取任意一个技术领域的多个原始数据;确定任意两个原始数据之间的关联关系,关联关系包括:等同关系、层级关系和相关关系;使用本体编辑工具将多个原始数据以及原始数据之间的关联关系按照示例本体文件进行编写,生成技术领域的领域本体。本发明解决了现有技术构建本体的方法效率低的技术问题。
【IPC分类】G06F9/44
【公开号】CN105528204
【申请号】CN201510039354
【发明人】汪雪锋, 朱东华, 李兵, 朱福进
【申请人】北京理工大学
【公开日】2016年4月27日
【申请日】2015年1月27日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1