一种空间态势特征事件数据库设计方法与流程

文档序号:13844610阅读:255来源:国知局
一种空间态势特征事件数据库设计方法与流程

本发明属于空间态势感知、空间态势评估等技术领域。针对空间态势数据多源异构、分布式的特点,在分析空间态势构成要素的基础上,构建空间数据模型,最终完成空间态势一体化数据模型的构建。



背景技术:

空间态势事件信息主要是关于世界各国所开展航天活动的新闻报道,事件数据库就是对这些数据信息的归类存储和维护管理,以供后续空间态势评估分析使用。

“我国群体性事件数据库的构建与应用”(公共安全,2017年03期)一文基于慧科新闻数据库,通过抽样48篇新闻报道,采用rostcm6.0对所抽样的新闻报道进行分词以及高频词分析,提取了关于我国群体性事件的30个高频词。然后基于高频词从600多万条相关新闻中筛选出关于我国群体性事件的5708篇新闻报道,并对这些新闻报道编码、信度检验,构建了我国群体性事件数据库(1998-2014)。该数据库将每条事件信息分解为17个字段进行编码,但该方法对于不同来源、不同数据结构的事件信息无法采用统一的编码格式进行编码。“基于特征的空间态势一体化数据模型”(测绘工程,2015年第24卷第8期)一文采用基于特征的建模方法进行概念建模,并结合面向对象的方法进行逻辑模型设计,基于xml构建空间态势数据物理模型,实现了空间态势一体化数据模型的构建。该方法的关注点是空间态势信息构成要素的综合表达,不涉及事件信息的存储管理。

空间事件情报信息主要来自九大领域信息源:“空间法律与政策”、“航天设施与装备”、“组织机构与人员”、“空间装备的运用策略”、“军民商用的权衡策略”、“国际交往的纵横策略”、“自然空间资源与环境”、“社会理念与科技环境”和“空间态势感知与综合评估”。关于各类空间事件的描述差异性较大,不同的情报信息包含的要素不同,关注的重点不同,不存在统一的事件描述格式。因此,当前数据库设计技术不足以直接支持空间态势特征事件数据库的设计实现。



技术实现要素:

本发明的技术解决问题是:克服现有技术的不足,提供了一种航天伺服阀研制全流程防差错方法。

本发明的技术解决方案是:一种空间态势特征事件数据库设计方法,步骤如下:

(1)将当前所有的空间态势特征事件数据划分为规范化数据和描述性数据;所述的规范化数据为第三方发布的空间态势相关数据表,描述性数据为新闻媒体报道的空间态势特征事件;

(2)按照规范化数据的关键词在数据库中建立对应的空表格,并将规范化数据的内容导入该空表格,形成规范化数据库表单;

对描述性数据执行如下处理:

(3)对描述性数据进行预处理,从数据中提取题目、国别、时间、关键词、内容和来源;

(4)建立数据库表单,将题目、国别、时间、关键词、内容和来源以及标签、附件作为表单的表头,利用步骤(3)提取的信息完成表单的初始填充;其中标签部分的内容为空,内容部分填充新闻媒体报道中的全部文字信息;附件中包含完整的新闻媒体报道信息;

(5)建立标签库,标签库中的表头包括空间法律与政策、航天设施与装备、组织机构与人员、空间装备的运用策略、军民商用的权衡策略、国际交往的纵横策略、自然空间资源与环境、社会理念与科技环境和空间态势感知与综合评估;

(6)根据步骤(4)中数据库表单中关键词出现的频率,根据关键词出现的频率计算关键词的权重,选取权重超过预设值的关键词作为标签,并将该条标签归类填充至步骤(5)中对应的表头;

(7)将数据库表单中每条空间态势特征事件对应的关键词与标签库中的标签进行对比,将匹配的标签填入该条事件表头的标签部分。

进一步的,为数据库设计可视化交互页面,可视化页面包括规范化数据和描述性数据两个可视化页面,每个可视化页面上包含数据导入功能。

进一步的,每个可视化交互页面中除数据导入功能外还包含两部分,一部分将题目作为列表进行显示,另一部分显示与题目相关联的完整数据库表单信息。

进一步的,定期或者实时利用数据导入功能导入单条空间态势特征事件数据或者批量导入空间态势特征事件数据,对当前所有的空间态势特征事件数据重新执行步骤(1)-(7),完成数据库的更新。

进一步的,通过输入特定时间段的数据,执行步骤(1)-(6),并在步骤(6)中根据权重将关键词进行排序,进而确定该特定时间段内的热点空间态势词汇。

本发明与现有技术相比有益效果为:

本发明旨在构造较优的数据库模式,根据空间事件情报信息的特点设计数据的存储结构和数据对象之间的相互关系,建立空间事件数据库及其应用系统,使其能够有效地存储多源、异构的事件数据,满足多种用户需求(包括信息查询、归类和统计分析等功能)。本发明与现有技术相比有益效果为:

(1)可对异构的事件数据以统一方式存储。空间态势特征事件依据来源和所属领域的不同,其描述方式可能多种多样,简单的日志型的储存方式不利于后期的搜索和分析。例如:对空间立法的描述可能是“某年某月某国颁布了某部空间法律”,而对空间发射活动的描述可能是“某年某月某日的某时刻某国在某地发射了某型火箭,搭载了某些有效载荷”,对空间特征事件的描述既有共同的字段/关键字(如时间),也有不同的部分(如具体活动内容)。细颗粒度的字段设计工作量庞大,而且难以保证全面覆盖。本发明分析和提取事件描述的共同字段/键词(包括题目、国别、时间等),并完整保留各条事件信息的内容描述部分,使得不同类型的事件信息能以统一的方式进行存储。

(2)构建了标签库,实现了对事件信息的标注,方便开展高级和深度搜索。上述事件信息的统一存储,只能支持按照有限关键词的简单搜索。为实现按照内容的检索,本发明设计了标签库,用于事件信息的标注。标签库中的标签即是空间事件的分类名称,通过在事件项中预留空关键词,由用户为每条事件信息勾选标签库中的标签,赋予其自定义标注,在搜索时输入关键词、标签或其组合就可实现事件信息的精确搜索。此外,标签库自身是可维护和扩展的,由用户根据实际需要修改或增加新的标签。

附图说明

图1为本发明流程图;

图2为本发明空间态势特征事件数据库结构;

图3为本发明空间态势特征事件数据库利用标签搜索示意图。

具体实施方式

一种空间态势特征事件数据库设计方法,如图1所示,步骤如下:

(1)将当前所有的空间态势特征事件数据划分为规范化数据和描述性数据;所述的规范化数据为第三方发布的空间态势相关数据表,描述性数据为新闻媒体报道的空间态势特征事件;

例如:美国忧思科学家联盟发布的卫星数据库(ucssatellitedatabase)就是典型的规范化数据,它是以excel格式发布的在轨卫星信息,以卫星名称、注册国、所有国、轨道类型、近地点高度、远地点高度、倾角、周期、发射质量等关键字为列,每行对应一颗具体的在轨卫星的所有相关参数。另一方面,“据每日卫星新闻网站报道,2014年4月2日,由24颗‘格洛纳斯’卫星组成的俄罗斯导航卫星系统出现故障,导致服务中断十几个小时。……”是一条空间态势特征事件的新闻报道,它是一段描述性的文字(也可包含图、表、多媒体等),没有进行关键词分解。

(2)按照规范化数据的关键词在数据库中建立对应的空表格,并将规范化数据的内容导入该空表格,形成规范化数据库表单;

对描述性数据执行如下处理:

(3)对描述性数据进行预处理,从数据中提取题目、国别、时间、关键词、内容和来源;

例如:还是以“据每日卫星新闻网站报道,2014年4月2日,由24颗‘格洛纳斯’卫星组成的俄罗斯导航卫星系统出现故障,导致服务中断十几个小时。……”描述性数据为例,提取题目为“俄罗斯‘格洛纳斯’卫星导航系统出故障”,国别为“俄罗斯”,时间为“2014年4月2日”,关键词为“格洛纳斯、导航系统、故障”,内容为该条新闻的完整文字描述,来源为“每日卫星新闻网站”。

(4)建立数据库表单,将题目、国别、时间、关键词、内容和来源以及标签、附件作为表单的表头,利用步骤(3)提取的信息完成表单的初始填充;其中标签部分的内容为空,内容部分填充新闻媒体报道中的全部文字信息;附件中包含完整的新闻媒体报道信息。如图2下半部分所示;

(5)建立标签库,标签库中的表头包括空间法律与政策、航天设施与装备、组织机构与人员、空间装备的运用策略、军民商用的权衡策略、国际交往的纵横策略、自然空间资源与环境、社会理念与科技环境和空间态势感知与综合评估。如图2上半部分所示;

(6)根据步骤(4)中数据库表单中关键词出现的频率,根据关键词出现的频率计算关键词的权重,选取权重超过预设值的关键词作为标签,并将该条标签归类填充至步骤(5)中对应的表头。如图2右半部分箭头所示;

例如:将空间态势特征事件数据导入数据库中后,关键词“导航系统”在整个数据库表单中一共出现n1次(词频),其他关键词分别出现n2、n3、……nk次,k为关键词总个数,计算关键词“导航系统”的权重为x=n1/(n1+n2+n3+……nk),权重预设值定位y,如果x>y,则将该关键词标签,并归类至标签库中“航天设施与装备”表头下。

(7)将数据库表单中每条空间态势特征事件对应的关键词与标签库中的标签进行对比,将匹配的标签填入该条事件表头的标签部分。

例如:还是以“据每日卫星新闻网站报道,2014年4月2日,由24颗‘格洛纳斯’卫星组成的俄罗斯导航卫星系统出现故障,导致服务中断十几个小时。……”描述性数据为例,该事件包含关键词“导航系统”,假设该关键词通过步骤(6)处理被归类在标签库中,说明该条空间态势特征事件对应的关键词与标签库中的标签有匹配,则将“导航系统”填入数据库表单中该条描述性数据的标签部分。

(8)为数据库设计可视化交互页面,可视化页面包括规范化数据和描述性数据两个可视化页面,每个可视化页面上包含数据导入功能。上述可视化页面直接从数据库中读取相关数据库表单,以行列的形式展示。数据导入包括单条导入和批量导入,单条数据导入为弹出对话框,手工填写空间态势特征事件的题目、国别、时间、关键词、内容和来源,并上传附件,以上操作均利用通用控件实现。最后,通过步骤(7)填入该项事件数据的标签。批量导入可一次性将规范化预处理后的空间态势特征事件数据整体导入,利用通用控件实现。

(9)当数据库中增加新的空间态势特征事件数据时,自动触发步骤(6)中的计算操作,更新关键词词频、权重,重新对关键词排序,提取标签并更新标签库。

(10)通过输入特定时间段的数据,执行步骤(1)-(6),并在步骤(6)中根据权重将关键词进行排序,进而确定该特定时间段内的热点空间态势词汇。

例如:输入2015年1月1日至2015年12月31日的空间态势特征事件数据,执行步骤(1)-(6)的所有操作,得出该时间段内的热点空间态势词汇排序为:“可重复使用、深空探测、电推进、互联网星座、……”,取前几位为年度热点空间态势词汇。

(11)为数据库设计搜索功能,包括一般搜索和深度搜索。一般搜索即设置下拉列表,由用户选择数据库表单表头中的“国别”和“时间”项,由用户输入单个关键词进行数据库搜索,列出事件清单。深度搜索可按一般关键词或多个关键词组合搜索,多个关键词进行组合搜索时由用户选择逻辑“与”或者“或”的关系;也可将单个或多个关键词与单个或多个标签一起作组合搜索,标签数量为用户自定义,关键词之间的关系由用户选择为“与”或者“或”,标签项之间关系由用户选择为“与”或者“或”,关键词与标签之间固定为逻辑“与”的关系。如图3所示。利用通用控件实现。

例如:可为关键词“国别”项选择或输入值“美国”进行单独搜索;也可将关键词“国别”项和“时间”项分别选择或输入值“美国”和“2014.01.12”,逻辑关系选择为“与”,进行组合搜索;还可将搜索条件设为:关键词“国别”项为“美国”,标签项分别设为“深空”、“小行星”、“月球”,标签项相互之间为逻辑“或”关系,进行数据库搜索。

本发明未详细说明部分属于本领域技术人员公知常识。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1