基于本体的信息安全事件智能检索系统的制作方法

文档序号:9787396阅读:414来源:国知局
基于本体的信息安全事件智能检索系统的制作方法
【技术领域】
[0001] 本发明属于信息检索技术范畴,具体为基于本体的信息安全事件智能检索系统。 本发明面向信息安全事件领域,能为用户提供信息安全事件相关知识的获取和智能检索功 能。
【背景技术】
[0002] 随着计算机网络技术的快速发展,我国在网络化建设方面取得了巨大的发展。伴 随着信息产业发展而产生的互联网和网络信息安全问题,也已成为各国政府有关部门、各 大行业和企事业领导人关注的热点问题。目前,全世界每年由于信息系统的脆弱性而导致 的经济损失逐年上升,安全问题日益严重,互联网上关于信息安全事件的信息也迅速增多, 为了更好地应对信息安全事件,就需要从浩瀚的信息海洋中快速而准确地获取到所需要的 信息安全事件相关信息和知识。信息检索系统作为网络信息平台的一个重要组成部分,在 用户获取网上信息的过程中发挥了不可替代的作用,已经成为人们获取信息必不可少的工 具。随着人们对信息检索需求的不断提高,传统的信息检索工具暴露出许多问题。首先,传 统的信息检索工具大都采用基于关键词的用户需求获取机制,对用户需求理解不足,无法 实现扩展检索,不可避免会造成语义上的丢失,输出大量无用的垃圾信息,而且搜索的智能 化程度不高,无法通过简单的推理进行检索。
[0003] 本体是概念化的显式描述,它提供了实际知识的形式化语义表示,支持数据、信息 和知识的交换、重用和共享,且可以在不同的建模方法、范式、语言和软件工具之间进行翻 译和映射,解决异构问题。本体具有良好的概念层次结构和对逻辑推理的支持,把本体融合 到传统信息检索技术中,不仅可以继承传统的信息检索的优点,还可以克服不能对概念关 系进行处理的局限性。因此,本发明面向信息安全事件领域,提出了信息安全本体的构建方 法和信息安全领域概念和关系的自动抽取方法,用于实现信息安全事件本体的自动扩展, 一方面能够极大地提高效率。提出了基于本体和语义相似度计算模型的查询扩展和排序方 法,能够从语义上理解和处理用户查询。根据本体中的语义关系设计了推理规则,实现了简 单的信息安全事件本体推理,在此基础上建立了信息安全事件智能检索系统。

【发明内容】

[0004] 本发明的目的在于提供一种基于本体的信息安全事件智能检索系统,自动获取信 息安全事件领域知识和实现语义检索。具体来说,本
【发明内容】
包括以下几点。
[0005] (1)基于本体的信息安全事件智能信息检索系统架构:由信息采集、信息安全事 件本体构建和扩展、语义标注、语义索引、查询处理、检索和排序几个部分组成。
[0006] (2)信息安全事件本体扩展与管理:基于OWL构建初始的信息安全事件本体,采用 基于Bootstrapping的概念抽取方法和基于扩展关联规则和关系抽取规则的混合关系抽 取方法,从信息安全领域文档中自动抽取出领域概念和概念间存在的关系,采用OWL构造 算子表示出来,并基于网页结构抽取信息安全事件实例自动添加到本体库中。用户可以在 前台进行信息事件知识查询以及实例添加、修改和删除操作。
[0007] (3)基于Jena的信息安全事件本体查询与推理:基于Jena推理机进行信息安全 事件领域知识的查询和推理,根据用户查询推理出关联信息,而且可以查看实例的详细信 息。
[0008] (4)信息安全事件语义检索:为文本文档建立索引,基于信息安全事件本体中的 语义关系扩展出与用户输入相关的概念或实例,采用基于本体的语义相似度计算方法进行 相似度大小的计算,只取阈值范围内的概念作为扩展查询词。然后采用改进的基于语义相 似度计算模型的排序方法,将检索结果按相关性大小返回给用户,实现语义检索。
【附图说明】
[0009] 图1为基于本体的信息安全事件智能检索系统架构;
[0010] 图2为信息安全事件领域本体扩展框架;
[0011] 图3为基于信息安全事件本体的推理机制。
【具体实施方式】
[0012] 为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实例 对本发明做进一步的详细说明。本发明实现的系统平台采用MyEclipse 8. 5+Jena 2. 5+ICTCLAS5。
[0013] 1.系统架构
[0014] 系统架构如图1所示,首先需要从互联网上采集信息安全事件的相关信息,并进 行预处理和信息抽取,从语义网上获取本体或者根据领域检索需求构建本体,通过本体学 习方法自动获取本体中的概念和概念间关系等,或者通过信息抽取和标注的方法构建本 体,并对本体库不断进行扩展。在文本文档中识别出本体中的实体,包括本体中的类、属性、 实例等,然后生成相应的标记。语义标注和传统的信息检索索引过程类似,只是索引的是本 体中的实体,而不是纯关键词。在语义标注结果的基础上即可为文本文档建立基于本体的 索引,建立文档和一系列的语义实体和语义关系的连接,给语义实体和关系赋予权重,用领 域本体中各种概念的语义关系来描述文档的语义。对于用户输入的查询内容,需要进行分 词等预处理并与本体的内容进行匹配,基于本体的语义关系和描述逻辑公理进行查询扩展 和推理,得到新的更能反映用户查询意图的查询词。最后对新的查询词进行检索,基于语义 相关度计算出实例与文档的相关度后,还需要计算查询实例与文档的相似度等,得到各个 文档的排序得分,最后按排序得分高低将排好序的检索结果返回给用户。
[0015] 2.信息安全事件本体扩展与管理
[0016] 本体的构建是一个迭代的过程,初始的信息安全事件本体构建完成后需要不断完 善和扩展。信息安全事件领域本体自动扩展框架如图2所示,包括领域资源、信息安全事件 领域概念抽取、概念间语义关系抽取和形式化表示4个组成部分。首先可以复用信息安全 事件知识源中已有的知识,如复用已有的信息安全事件本体,还可以从信息安全事件知识 源中抽取出实例信息,但是信息安全事件知识源需满足以下几个要求:知识未陈旧过时、知 识可信度高(如标准化的知识源)、知识覆盖面广等。目前随着人们对信息安全事件越来越 关注,从不同角度建立的信息安全事件本体也会越来越多,可以进行复用。关于信息安全事 件实例的信息,如信息安全事件名称、类别、发生时间、地点、详情,也可以基于信息安全事 件知识源的结构进行抽取。
[0017] 对于不是来自于信息安全事件知识源的信息安全事件领域文档,需要先从中抽 取出关键信息,得到信息安全事件语料,然后进行分词、去除停用词等预处理,接下来基于 Bootstrapping的领域概念抽取方法以及基于扩展关联规则和关系抽取规则的方法抽取出 信息安全事件概念和概念间的语义关系。最后将所获得的概念、概念间关系、实例信息用 OWL语言的构造分子形式化地表示出来,即可完成信息安全事件领域本体的扩展。用户可以 手动编辑信息安全事件本体中的信息安全事件知识和实例属性信息,可以查看某个类的属 性和所拥有的实例,可以修改其中不准确的信息,或直接删除,还可以添加新的实例及其属 性信息。
[0018] 3.基于Jena的信息安全事件本体推理
[0019] 信息安全事件本体初步建立起来后,即可基于其进行查询和推理。本系统采用了 基于规则的推理方法来对信息安全事件本体进行推理,首先进行信息安全事件本体推理规 则设计,然后导入Jena推理机进行推理,得出推理结果并用于信息检索中。
[0020] 推理规则语法:Rule-Name :Ρ1Ρ2Ρ3· · · Pn - C ;
[0021] 其中,Rule-Name为领域规则名,Pi (i = 1,2,...,η)为原来模型中已经存在的三 元组,C是可以推导出的三元组。整个推理规则为:如果左边前提为真,则得到右边的结论。
[0022] 本系统基于信息安全事件本体、描述逻辑和OWL DL的基本公理来描述基于本体的 推理规则。根据信息安全事件本体概念间的语义关系:分类关系、实例关系、等价关系、因果 关系(cause、causedby)、时间关系、类似关系等设计推理规则,例如:
[0023] [inverseOf : ( ? P owl : inverseOf ? Q),(? X? P? Y)->(? Y? Q? X)]
[0024] 说明:若P属性和Q属性互逆,X和Y之间存在P属性关系,则Y和X之间存在Q 属性关系。
[0025] [inverseOf 1 :(? cause owl :inverse0f ? causedby) Λ (? H? cause? I)-> (? I ? causedby ? H)]
[0026] 说明:cause和causeby是互逆的属性,H和I之间存在cause关系,则I和H之间 存在causedby关系。
[0027] [symmetricPropertyl : ( ? R rdf :type owl :SymmetricProperty) Λ ( ? N ? R ? 0)->(? 0 ? R ? Ν)]
[0028] 说明:R具有对称性,N和0之间存在R属性关系,则0和N之间也存在R属性关 系。
[0029] [symmetricProperty2 : ( ? resemble rdf : type owl :SymmetricProperty) Λ (? N ? resemble ? 0)->
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1