一种基于电网统计数据的搜索方法与流程

文档序号:11918756阅读:321来源:国知局

本发明涉及电力技术领域,特别是指一种基于电网统计数据的搜索方法。



背景技术:

为巩固和加强公司2014年统计工作成果,高效利用数据资源,本项目依托大数据技术及“一库三中心”深入开展统计分析相关工作,对公司的统计工作存在不足的地方进行完善加强。主要在如下几个方面:一是电网统计数据搜索能力需进一步加强。公司统计归口管理不够到位,统计的指标体系、指标解释、报表制度、数据存储与发布还比较分散,专业部门之间存在交叉重复统计与数据冗余的现象,指标数据查找与检索需要新的工具与手段。二是面向电力应用的可视化与统计发布服务水平需进一步提升。面对国网公司庞大的数据资源与丰富的发布产品,需要提升计算机可视化及人机交互技术,并规划拓展发布内容及渠道,形成对内统一归口、对外统一报送,定期发布、灵活查询的统计权威发布服务。三是面向规划计划决策应用的统计数据模型需进一步完善。针对公司规划、电网规划、电网前期等规划管理业务及综合计划、投资计划、生产计划等计划管理的业务特点和决策要求,需通过数理分析方法为决策者提供量化分析和数据信息,并形成相应决策模型。



技术实现要素:

有鉴于此,本发明的目的在于提出一种减少电网指标数据的查找速度,增强数据的索引能力的基于电网统计数据的搜索方法。

基于上述目的本发明提供的一种基于电网统计数据的搜索方法,包括:

构建基于电网统计业务数据的本体关键词词典,提升数据搜索准确度;

建立基于海量电网统计数据的搜索引擎,提供任意输入搜索条件,自动辨识指标、地区、时间等维度信息,实现高效模糊搜索;

快速精准定位数据,自动展示搜索指标相关数据;

提供查询结果快速排序、筛选、过滤功能。

在一些实施方式中,所述方法还包括:

对搜索结果通过指标、地区、时间等维度向下进行数据穿透。

在一些实施方式中,所述自动展示搜索指标相关数据包括:

展示数据字段;所述数据字段包括:指标名称、地区、数据时间、时间、数值、所属栏目、栏目、相关报表。

从上面所述可以看出,本发明提供的基于电网统计数据的搜索方法,以国家电网统一数据资源库数据为基础,研究了基于电网统计数据的百度模式智能搜索技术,通过定义查询模型,建立电网业统计的本体词典,选取适合的搜索算法,建立适用于海量电网统计业务数据的智能搜索引擎,提升搜索效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例的基于电网统计数据的搜索方法流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。

参考图1,为本发明实施例的基于电网统计数据的搜索方法流程图。

本发明实施例提供了一种基于电网统计数据的搜索方法,包括:

步骤101、构建基于电网统计业务数据的本体关键词词典,提升数据搜索准确度;

步骤102、建立基于海量电网统计数据的搜索引擎,提供任意输入搜索条件,自动辨识指标、地区、时间等维度信息,实现高效模糊搜索;

步骤103、快速精准定位数据,自动展示搜索指标相关数据;

步骤104、提供查询结果快速排序、筛选、过滤功能。

在一些实施例,所述方法还包括:

对搜索结果通过指标、地区、时间等维度向下进行数据穿透。

在一些实施例,所述自动展示搜索指标相关数据包括:

展示数据字段;所述数据字段包括:指标名称、地区、数据时间、时间、数值、所属栏目、栏目、相关报表。

本发明提供的基于电网统计数据的搜索方法,以国家电网统一数据资源库数据为基础,研究了基于电网统计数据的百度模式智能搜索技术,通过定义查询模型,建立电网业统计的本体词典,选取适合的搜索算法,建立适用于海量电网统计业务数据的智能搜索引擎,提升搜索效率。

在一些具体的实施例中,本发明的基于电网统计数据的搜索方法包括:

以国家电网统一数据资源库数据为基础,研究基于电网统计数据的百度模式智能搜索技术,通过定义查询模型,建立电网业统计的本体词典,选取适合的搜索算法,建立适用于海量电网统计业务数据的智能搜索引擎,提升搜索效率。

关键词输入:可根据关键词进行指标数据高效模糊查询;

快速定位:根据搜索条件快速精准定位数据,并自动展示搜索指标相关结果数据集,并能够对查询结果快速排序、筛选、过滤;

数据钻取:可对搜索结果通过指标、地区、时间等维度向下进行数据穿透。

本发明基于大数据分析挖掘,全面梳理并研究国网江苏省电力公司电网统计业务数据情况,电网涉及业务内容广泛,需要梳理多类业务指标间关联关系开展项目研究工作,结合当前实际情况,项目研究具有如下关键点及难点:

(1)数据收集

目前系统建设所需大部分数据来源国家电网公司统一数据资源库,由于统一数据资源库为一级部署,且数据结构复杂,如需获取实时数据,需协调总部信通公司开放相关端口,协调统一数据资源库厂商按照系统建设所需数据需求格式提供数据接口,且数据接口方式直接决定系统功能实现程度,是本次研究工作的关键点之一。

解决措施:梳理系统建设所需数据需求及数据结构,充分调动用户、统一数据资源库厂商资源,与统一数据资源库厂商深入沟通,选取适合的数据接口方式,保障数据传输时效性。

(2)构建辅助决策模型

国家电网公司统一数据资源库中包括:公司口径、公司经营区域口径、全国各省市电力行业、国民经济、工业行业、时间主要经济体和国家数据,由于统一数据资源库中的指标来源多个业务系统,统计周期和维度不同,经常会由于统计维度问题导致探索分析工作无法正常开展;针对每一个分析场景均需要针对其业务逻辑进行梳理,且数据模型的建立需要大量的研究、探索、验证工作,增加了本次研究的工作量,也是本次研究的关键点。

解决措施:充分梳理统一数据资源库中的指标数据维度信息,深入了解探索电网统计业务逻辑并挖掘需求点,组织相关业务专家进行分析模型研讨,通过多种途径确定合理的决策模型,降低时间进度成本。

(3)统计发布数据通道

统计发布中心需提供多渠道的数据发布功能,目前本项目提供内网PC端和手机移动终端数据发布渠道,由于发布数据来源于系统内网,移动终端为手机外网,根据国家电网公司安全防护方案的要求,共提供两种内外网数据通信方式,即:接入安全接入平台和安全隔离装置,如何在保证数据传输效率的基础上选取适合的安全接入方式建立内外网数据传输通道成为本项目的技术难点。

解决措施:在遵循国网公司内外网安全防护方案的前提下,充分了解用户移动终端功能需求,借鉴相关项目经验,调动省公司业务部门积极性,组织当地信通公司相关人员进行研讨,选取适合的安全接入方案。

基于大数据技术的国家电网统计“一库三中心”深化应用研究技术要求,我们采用J2EE技术路线,按照SOA面向服务架构设计,分为展示层、应用服务层、业务逻辑层、基础业务服务层、技术服务层及基础架构服务层等六层实现技术体系架构。包括如下方面:遵循J2EE技术规范,采用组件化、动态化的软件技术,利用一致的可共享的数据模型,整体规划系统的技术架构,以提高后端应用软件的灵活性、可扩展性、安全性以及并发处理能力。SoTower开发平台,支持基于主流数据库进行开发,技术架构按照多层架构体系,将界面控制、业务逻辑和数据映射分离,实现系统内部的松耦合,以灵活、快速地响应业务变化对系统的需求。技术架构按照S0A面向服务架构设计,总体上划分为展示层、应用服务层、业务逻辑层、基础业务服务层、技术服务层及基础架构服务层,通过各层次系统组件间服务的承载关系,实现系统功能。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。

另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。

本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1