一种空中交通管理领域的本体交互模型构建方法与流程

文档序号:17442872发布日期:2019-04-17 05:01阅读:257来源:国知局
一种空中交通管理领域的本体交互模型构建方法与流程

本发明涉及知识服务领域,尤其涉及一种空中交通管理领域的本体交互模型构建方法。



背景技术:

staan等对前人定义的进行研究总结后,认为:“本体是共享概念模型的形式化规范说明”,它体现了本体的四个层次:

(1)概念模型通过抽象出客观世界中一些现象的相关概念而得到的模型,其表示的含义独立于具体的环境状态。

(2)明确所使用的概念及使用这些概念的约束都有明确的定义。

(3)形式化本体是能被计算机读取并处理的。

(4)共享本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是集体而不是个体。

概念可认为是一个类,下文中概念与类这两个词等价。本体使用约定的词汇,提供了一套良好的构造,以一个明确和清晰的方式在指定的术语系统上建立有意义的高层次语义知识。对一个特定的领域,本体使用一种丰富的语言对资源及其属性的类型提供更复杂的约束条件。与普通的分类相比,本体增加了语义术语用来词汇术语中提供更丰富的关系。本体通常使用一种逻辑性很强的语言进行表达,因此可以在类,属性,关系之间实现详细、有意义的表达,其主要应用方面有:用于协助人与人之间的沟通;用于空管系统之间的互操作与互相通信;用于全域信息管理系统(systemwideinformationmanagement,swim)的web服务发现。

然而,当前的空管缺乏统一的知识模型,缺乏对领域知识的规范化定义,造成对同一知识的描述可能不同,影响用户对这一知识的理解和共享。在搜索相关信息时,对于同义不同名的关键字由于实际满足用户需求的服务没有完全查出,导致了查全率低;对于同名不同义的关键字由于查询结果会得到毫不相干的服务,所以导致了查准率低的问题。因此,如何对空管本体进行准确的构建,以提高后续语义识别的精准度和swim系统web服务发现准确性是目前亟待解决的技术问题。



技术实现要素:

发明目的:本发明所要解决的技术问题是针对现有技术没有空管领域的本体构建方法,提供一种空管领域本体交互模型的构建方法及扩展方法,具有良好的可操作性和可扩展性,具体包括如下步骤:

步骤1,获取空管领域相关的文档;

步骤2,从空管领域相关的文档中抽取空管领域本体所需要的概念;

步骤3,对抽取的概念进行分类,并确定类的层次结构;

步骤4,抽取类之间的关系,构建本体的属性;

步骤5,基于用户查询的语句,动态扩充本体;

步骤6,构建关键词的中英文词典,支持多语言本体。

步骤1包括:

步骤1-1,获取结构化文档,包括国际民航组织标准的飞行信息、航空信息、气象信息交换模型;

步骤1-2,获取非结构化文档,包括空管机构公开的web服务描述、web网页信息;

步骤1-3,获取的结构化文档和非结构化文档作为空管领域相关的文档。

步骤2包括:

步骤2-1,从结构化文档中统计出现的概念:结构化文档为xml结构,每个结构化文档包含两个以上xml标签,每个标签映射为本体的一个概念,则每个结构化文档形成一个概念集sci,对所有结构化文档,形成两个以上的概念集,来源于n个结构化文档的概念集为sc=sc1∪sc2∪…∪scn,scn表示第n个结构化文档形成的概念集;

步骤2-2,利用分词工具对非结构化文档进行分词和词性标注,去除停用词,并针对非结构化文档的分词结果进行统计,出现频率为所有词的前50%的词经过审核作为一个概念集uci,来源于m个非结构化文档的概念集为uc=uc1∪uc2∪…∪ucm,ucm表示第m个非结构化文档形成的概念集;

步骤2-3,空管领域本体所需要的概念集为c=sc∪uc。

步骤3包括:

步骤3-1,将空管领域本体分成不相交的类,初始状态时,空管领域的每个概念都为一个类;

步骤3-2,基于步骤3-1,利用wordnet计算所有类两两之间的相似度,得到类之间的相似度矩阵,并利用谱聚类算法形成n1个类;

步骤3-3,人工为n1个类命名,并针对这n1个类进行步骤3-2中的操作,形成n2,n3等不同数量,逐层往上的类。直到最后形成一个总体的空管领域类。由上向下组织这些类,形成本体的层次结构。步骤4包括:

步骤4-1,飞行信息、航空信息、气象信息交换模型为xml结构,自身包含了信息之间的关系。信息在步骤3中已对应为本体中的类,信息之间的关系则可对应为本体类之间的关系;

步骤4-2,根据步骤2-2的分词及词性标注的结果,统计两个词在文档中同时出现的频率,若同时出现频率为所有关系的前50%,则判定两个词之间可能存在关系,返回由本体构建者确定。

步骤5包括:

步骤5-1,利用分词工具对用户查询的语句进行分词;

步骤5-2,若用户查询的语句的分词结果已存在于步骤4和步骤5构建的本体中,则结束;

步骤5-3,将用户查询的语句的分词结果与概念集c中的概念进行匹配,若用户查询的语句的分词结果在本体中不存在,根据近义词查询软件在本体中搜索相近的概念,搜索到的相近概念作为新概念提交由本体构建者审核,若审核通过,则将新概念加入概念集c中。

步骤6包括:

步骤6-1,构建空管领域中英文词典:将概念集c中的中文概念翻译成英文,英文翻译成中文;;

步骤6-2,对于英文搜索请求,先根据空管领域中英文词典转换成中文,完成搜索后转换成英文输出。从而得到构建好的本体交互模型。

利用构建的本体交互模型,完成跨语言的空管信息查询,利用本体概念之间的属性关系搜索相关联的信息,并支持全域信息管理(systemwideinformationmanagement,swim)的webservice服务发现。

有益效果:本发明显著优点是:

1、面向空管领域构建本体,数据来源可靠,本体实用性强。

2、本体层次结构设计通过迭代过程实现,可靠性高。

3、基于用户用户查询的语句扩展本体,本体可扩展性强。

4、基于中英文词典进行多语言扩展,在不增加本体大小的情况下支持多语言。

附图说明

下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述或其他方面的优点将会变得更加清楚。

图1是本发明的本体层次结构构建过程示意图。

图2是本发明的本体属性获得方法示意图。

图3是本发明的基于搜索的本体扩展方法示意图。

图4是本发明的本体多语言扩展方法示意图。

图5为本发明流程图。

图6为本体的结构图。

图7为本体的应用的示意图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

如图5所示,本发明提供了一种空中交通管理领域的本体交互模型构建方法,包括获取空管领域相关的文档;列举空管领域常用的概念;对所有的概念进行分类,并确定类的层次结构;抽取类之间的关系,构建本体的属性;基于用户查询的语句,动态扩充本体;构建关键词的中英文词典,支持多语言本体。

构建空管领域本体交互模型首先需要获取该领域的概念。而概念的来源是空管领域相关的文档。一般的领域本体构建选择的是非结构化的文本并从中抽取概念。而空管领域有很多结构化的数据模型与非结构化文档。选择合适的概念来源有助于提升本体的完整性。本发明中数据来源包括:

结构化文档:飞行信息、航空信息、气象信息等交换模型;

非结构化文档:知名空管机构公开的web服务描述、web网页信息

对于上述文档,需要抽取出空管领域本体所需的概念。本发明针对结构化文档和非结构化文档设计了不同的方案。

结构化文档一般为xml结构,每个结构化文档包含多个xml标签,每个标签映射为本体的一个概念。因此,每个结构化文档形成一个概念集sci。对所有结构化文档,形成多个概念集。因此,来源于n个结构化文档的概念集为sc=sc1∪sc2∪…∪scn。

非结构化文档一般来自于文本描述信息,无法直接完成向本体概念的映射。本发明提出先对非结构化文档进行分词,并进行词性标注。该部分工作可由jieba分词等软件工具完成。针对某个非结构化文档的分词结果进行统计,出现次数多的词经过人工审核作为一个概念集uci。来源于m个非结构化文档的概念集为uc=uc1∪uc2∪…∪ucm。

因此,本体概念集为c=sc∪uc。

本体的类和类之间具有层次结构。层次结构可通过自顶向下的本体设计以及概念自动分类得出。首先将空管领域本体分成若干不相交的类,如机构、人员、设备等。将本体概念集c中的概念与上述类计算概念相似度,概念归为最相似的类中。概念相似度的计算方法可用synonyms等软件工具计算。对每一类别下的概念持续进行分类——计算相似度——归类操作,直到形成完整的本体层次结构。详细过程如图1所示。

本体不仅有类,还有相关的数据属性(dataproperty)和对象属性(objectproperty)。针对结构化文档,数据属性可直接获得。对象属性通过统计所有交互消息中不同对象同时出现的情况,抽取两者关系。多次同时出现在同一消息中认为两者之间存在对象属性关系。非结构化文档需要根据分词结果,按与结构化文档相同的抽取方式获取数据属性和对象属性。过程如图2所示。

本体模型与软件一样,需要动态地扩展,以满足增加概念的需求。而扩展本体模型的方法一般是专家根据经验人工扩展。本发明提出一种依据搜索输入对本体进行扩展的方法。由于本体一般是用于支持搜索,而搜索的过程中,用户会输入不同的查询语句。查询语句会有一定的概率出现词语不在本体包含的概念中。此时可利用用户查询的语句的信息对本体进行扩展。扩展的过程是首先对用户查询的语句进行分词和记性标注。然后将词语与本体中的概念进行匹配。若某个概念不在本体中,则利用synonyms等软件工具计算新概念与当前本体概念中的相似度,给出分类建议交由人工审核。若审核通过,则加入当前本体中。过程如图3所示。

由于空管领域涉及到多个国家不同机构之间的交互,本体作为支持交互的共享概念模型,需要支持多语言。多语言扩展的一种方法是将所有对应的中英文定义为等价概念。此方法的问题在于本体中概念多了以后会产生大量的等价类,影响本体的管理。本发明提出基于中英文词典的多语言扩展方案,将等价类的映射在本体外完成。如果输入为英文,首先对其进行分词,然后根据其领域概念的映射关系,对应为本体中相应的中文概念。根据中文查询结束后,将结果转换为英文返回。过程如图4所示。

实施例

选择飞行信息交换模型(fixm)、航空信息交换模型(aixm)、气象信息交换模型(wxxm)作为结构化文档的来源,faa、eurocontrol、中国民航局等官网和文档作为非结构化文档的来源。

来自fixm模型的概念有飞行数据、机场、飞行器、降落、能力、危险品、起飞、紧急事件、预计飞越边界、飞行轨迹等,来自aixm模型的概念有机场、机动区域可用性、停机坪、停机位、道路、旅客登机廊桥、跑道等,来自wxxm的概念有核心测量、几何对象、通用气象测量、空气温度、云层高度、深度等。

来自非结构化文档的语句需经过分词、挑选名词,选出合适的概念。例如“查找飞行器是否在本机场”,经分词后结果为:查找v、飞行器n、是否v、在p、本r、机场n。挑选出名词为飞行器和机场。其中,v表示动词,n表示名词,p表示介词,r表示代词。

因此,最终的概念集为数据、机场、飞行器、降落、能力、危险品、起飞、紧急事件、预计飞越边界、飞行轨迹、机动区域可用性、停机坪、停机位、道路、旅客登机廊桥、跑道、核心测量、几何对象、通用气象测量、空气温度、云层高度、深度等。

根据上述概念,设置不相交的若干类,所有概念集中的元素计算与各类名称的相似度或者依靠专家经验归属到某一类。子类包括:事件、人员、服务、数据、机构、设备。针对每一类重复此步骤,直至形成最终本体结构。

类之间的属性部分通过结构化文档直接获取,如机场有名称、地址等。另一部分从非结构化分词中获得,“在”这个属性定义域为飞行器,值域为机场。依据此方法获得所有属性。

用户的搜索信息可动态扩展本体交互模型。例如,当用户搜索“本地雷达信息”,当概念“雷达”在本体库中不存时,利用synonyms等软件工具计算“雷达”与本体中各概念的相似度,返回决策建议“是否将‘雷达’加入‘设备’”提交给本体编辑人员审核。

中英文词典通过构建概念对应的数据库表实现。表1所示的为一个数据库片段:

表1

因此,本体的多语言扩展可通过更新上述词典实现。

当本体交互模型构建完成后,可以支持丰富的数据查询,以及全域信息管理(systemwideinformationmanagement,swim)的webservice发现。swim为空管领域各机构(机场、航空公司、空管部分)向其它利益相关机构以webservice的形式提供数据的架构。当用户搜索“查询飞行计划fp01”时,如果不采用本体仅依靠关键词搜索,仅会返回与“查询”、“飞行”、“计划”等相关的信息。若采用本发明构建的空管领域本体交互模型,则可返回更多相关信息,以下结合图6、图7说明。图6为本体构建完成后部分类与实例的示意图。圆形图标表示类,菱形表示实例。图7展示了图6实例之间更具体的信息。根据用户的输入,首先找到本体中相应的实例。然后应用程序根据该实例的所有属性构建sparql查询语句,查询关联的实例(注:sparql为一种常用的本体查询语言)。找到“飞行计划fp01”这个实例后,sparql查询语句为“select?depairport

where{http://www.semanticweb.org/shengyin/ontologies/2018/9#飞行计划fp01http://www.semanticweb.org/shengyin/ontologies/2018/9#departureairport?depairport}”,“select?carriernamewhere{http://www.semanticweb.org/shengyin/ontologies/2018/9#飞行计划fp01http://www.semanticweb.org/shengyin/ontologies/2018/9#carrier?carriername}”和“select?arrairport

where{http://www.semanticweb.org/shengyin/ontologies/2018/9#飞行计划fp01http://www.semanticweb.org/shengyin/ontologies/2018/9#arrivalairport?arrairport}”

上述查询语句可得出起飞机场为首都机场,降落机场为上海浦东机场,由东方航空运营。

当本体中没有相应的信息时,可根据属性查询相应的webservice并请求服务。以查询“跑道9r/27l”为例,构建sparql查询语句“select?webservicewhere{?webservicehttp://www.semanticweb.org/shengyin/ontologies/2018/9#providedatahttp://www.semanticweb.org/shengyin/ontologies/2018/9#跑道9r/27l}”可获得机场运行服务这个webservice的信息。该服务的信息包括服务输入、输出、wsdl等信息在本体构建时存入。

当请求为beijingcapitalinternationalairport时,根据中英文词典,该请求为查询为首都机场,可根据实例首都机场查询相关的气象信息与跑道信息。

因此,与传统的基于关键词的信息检索相比,基于本发明构建的空管领域本体可以有效地提升查全率与查准率,提升空管领域信息检索效果。

本发明提供了一种空中交通管理领域的本体交互模型构建方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1