一种电网运监数据分析报告的自动化生成方法及系统与流程

文档序号:16533708发布日期:2019-01-05 11:00阅读:304来源:国知局
一种电网运监数据分析报告的自动化生成方法及系统与流程

本发明涉及电网公司运监中心的信息管理领域,更具体的,涉及一种电网运监数据分析报告的自动化生成方法及系统。



背景技术:

电网企业的运监中心将电网企业业务部门(例如:营销、生产,资产、运行监控等)相关的业务系统数据进行统一汇集,按照业务场景需求进行融合性交叉分析,生成评价指标分析报告。能够及时发现运营指标缺陷,指导企业在运营层辅助决策。上述业务系统存有大量的静态与动态信息,这些信息中的不一致、不准确、不完整一直是困扰电网公司精细化管理的问题。随着各类信息系统的建设,新业务的开展,海量数据的涌入,使得电网企业信息质量的问题更加严重与紧迫,不掌握完整,准确的电网业务信息,电网的智能化运营与管理就无从谈起。

另外,基于数据的各类分析报告数量也在急剧增加,现有的数据分析报告的编写效率低下。通常采取人工分析抽查、编写报告,通过业务专家结合业务知识对数据进行手工分析,再把各个分析结果逐一人工复制到报告中,耗费了大量的人力、物力。



技术实现要素:

本发明为解决传统数据分析报告效率低下,耗费人力物力的缺陷,提供一种电网运监数据分析报告的自动化生成方法及系统。

一方面,本发明提供一种电网运监数据分析报告的自动化生成方法,包括:

获取报告模板文件,基于r语言编写分析处理程序;

根据所述分析处理程序,将所述报告模板文件转换为标记语言;

调用标记语言转换工具将所述标记语言生成指定格式的报告。

其中,所述方法还包括:

基于r语言编写数据校验程序,并根据所述数据校验程序,进行电网运监业务数据的异常性检验。

其中,所述根据所述分析处理程序,将所述报告模板文件转换为标记语言具体包括:

执行所述分析处理程序,将所述报告模板文件转换为markdown格式的标记语言。

其中,所述调用标记语言转换工具将所述标记语言生成指定格式的报告包括:

调用pandoc转换工具,将所述标记语言生成指定格式的报告;

其中,所述指定格式包括docx、pdf以及html。

其中,所述根据所述数据校验程序,进行电网运监业务数据的异常性检验具体包括:

执行数据校验程序,调用机器学习模型进行电网运监业务数据的异常性检验。

另一方面,本发明还一种电网运监数据分析报告的自动化生成系统,包括:

获取模块,用于获取报告模板文件,基于r语言编写分析处理程序;

转换模块,用于根据所述分析处理程序,将所述报告模板文件转换为标记语言;

报告生成模块,用于调用标记语言转换工具,将所述标记语言生成指定格式的报告。

其中,所述系统还包括:

校验模块,用于基于r语言编写数据校验程序,并根据所述数据校验程序,进行电网运监业务数据的异常性检验。

其中,所述转换模块具体用于:

执行所述分析处理程序,将所述报告模板文件转换为markdown格式的标记语言。

其中,所述报告生成模块具体用于:

调用pandoc转换工具,将所述标记语言生成指定格式的报告;

其中,所述指定格式包括docx、pdf以及html。

其中,所述校验模块具体用于:

执行数据校验程序,调用机器学习模型进行电网运监业务数据的异常性检验。

本发明实施例提供的电网运监数据分析报告的自动化生成方法及系统,基于r语言编写分析处理程序,执行分析处理程序,将所述报告模板文件转换为markdown格式的标记语言。调用标记语言转换工具,将标记语言生成指定格式的报告。本发明实现了数据分析报告的自动化生成。传统数据分析报告效率低下,耗费人力物力,本发明提高了分析效率,节约了人力成本。

附图说明

图1为根据本发明实施例提供的电网运监数据分析报告的自动化生成方法流程示意图;

图2a为根据本发明实施例提供的利用3-δ模型分析异常数据的示意图;

图2b为根据本发明实施例提供的利用局部回归模型分析异常数据的示意图;

图3为根据本发明实施例提供的电网运监数据分析报告的自动化生成系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一模块实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为根据本发明实施例提供的电网运监数据分析报告的自动化生成方法流程示意图。如图1所示,电网运监数据分析报告的自动化生成方法包括:

步骤101:获取报告模板文件,基于r语言编写分析处理程序;

具体地,电网运监数据分析报告是指,电网企业的运监中心将电网企业业务部门(例如:营销、生产,资产、运行监控等)相关的业务系统数据进行统一汇集,按照业务场景需求进行融合性交叉分析,生成评价指标分析报告。通过数据分析报告,能够及时发现运营指标缺陷,指导企业在运营层辅助决策。

本实施例中,首先从电网运监中心的数据库中获取报告模板文件。其中,报告模板文件包括两部分,分别是docx、pptx内容模板文件,以及rmd格式分析报告模板文件。基于r语言编写分析处理程序,r是一种用于统计分析、绘图的语言和操作环境。包括有效的数据存储和处理功能,一套完整的数组(特别是矩阵)计算操作符,拥有完整体系的数据分析工具,为数据分析和显示提供的强大图形功能,一套完善、简单、有效的编程语言。

步骤102,根据所述分析处理程序,将所述报告模板文件转换为标记语言;

本实施例中,执行上述分析处理程序,结合报告模板文件的内容与格式,将报告模板文件转换为markdown格式的标记语言。其中,markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式。markdown是一种轻量级标记语言,允许人们使用易读易写的纯文本格式编写文档,然后转换成有效的其他格式文档。

步骤103,调用标记语言转换工具,将所述标记语言生成指定格式的报告。

本实施例中,调用标记语言转换工具,将markdown格式的标记语言生成指定格式的报告,实现了数据分析报告的自动化生成。

本发明实施例提供的电网运监数据分析报告的自动化生成方法,基于r语言编写分析处理程序,执行分析处理程序,将所述报告模板文件转换为markdown格式的标记语言。调用标记语言转换工具,将标记语言生成指定格式的报告。本发明实现了数据分析报告的自动化生成。传统数据分析报告效率低下,耗费人力物力,本发明提高了分析效率,节约了人力成本。

在上述实施例的基础上,所述方法还包括:

基于r语言编写数据校验程序,并根据所述数据校验程序,进行电网运监业务数据的异常性检验。

具体地,r是一种用于统计分析、绘图的语言和操作环境。本实施例基于r语言编写数据校验程序,执行数据校验程序,进行电网运监业务数据的异常性检验,实现了电网运监数据的自动化异常性校验,与传统人工分析校验异常数据的方式相比,提高异常数据的检验效率。

在上述各实施例的基础上,步骤103中,所述调用标记语言转换工具,将所述标记语言生成指定格式的报告包括:

调用pandoc转换工具,将所述标记语言生成指定格式的报告;

其中,所述指定格式包括docx、pdf以及html。

具体地,对于markdown格式的标记语言,调用pandoc转换工具,将markdown格式的标记语言生成指定格式的报告,指定格式包括docx、pdf以及html。其中,pandoc是一种标记语言转换工具,可实现由标记输出为格式化文档,也可以进行不同标记语言间的格式转换。

对于docx、pptx格式的报告模板文件,调用reporters扩展包,将报告模板文件生成多种文件格式的报告,生成的报告包括docx文件、pptx文件,以及pdf格式的文件。

进一步地,利用数据可视化方法进行电网运监业务数据检验。数据可视化是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。数据可视化是指一种表示数据或信息的技术,它将数据或信息编码为包含在图形里的可见对象,如点、线、条等,目的是将信息更加清晰有效地传达给用户,是数据分析或数据科学的关键技术之一。简单地说,数据可视化就是以图形化方式表示数据。决策者可以通过图形直观地看到数据分析结果,从而更容易理解业务变化趋势或发现新的业务模式。使用可视化工具,可以在图形或图表上进行下钻,以进一步获得更细节的信息,交互式地观察数据改变或处理过程。

在上述各实施例的基础上,步骤103中,所述根据所述数据校验程序,进行电网运监业务数据的异常性检验具体包括:

执行数据校验程序,调用机器学习模型进行电网运监业务数据的异常性检验。

图2a为根据本发明实施例提供的利用3-δ模型分析异常数据的离群的示意图;图2b为根据本发明实施例提供的利用局部回归模型分析异常数据的离群的示意图;本实施例中,调用机器学习模型进行电网运监业务数据的异常性检验,涵盖了异常数据检测、筛选与处理三个步骤。异常数据检测采用了3-δ模型,利用3-δ模型分析异常数据的离群的示意图如图2a所示。异常值处理方法采用了简单剔除与局部回归模型相结合的方法,局部回归模型如图2b所示。采用3-δ模型、箱线模型进行历史数据的异常性检验,将异常数据处理后,采用局部回归模型获得合理参数范围,返回处理后的合理数据。

本发明实施例提供的电网运监数据分析报告的自动化生成方法,基于r语言编写分析处理程序,执行分析处理程序,将所述报告模板文件转换为markdown格式的标记语言。调用标记语言转换工具,将标记语言生成指定格式的报告。本发明实现了数据分析报告的自动化生成。传统数据分析报告效率低下,耗费人力物力,本发明提高了分析效率,节约了人力成本。

本发明实施例将电网企业多个业务部门的业务数据异常性检验模型化、标准化,应用机器学习模型实现标准化、自动化电网运监业务的数据异常校验,减轻人工分析校对的繁冗工作,提高数据质量与效率,减少数据分析人工成本、为基于数据的高级分析应用提供了重要保障。

图3为根据本发明实施例提供的电网运监数据分析报告的自动化生成系统的结构示意图。参照图3,该系统包括获取模块301,转换模块302和报告生成模块303,其中:

获取模块301用于获取报告模板文件,基于r语言编写分析处理程序。转换模块302用于根据所述分析处理程序,将所述报告模板文件转换为标记语言。报告生成模块303用于调用标记语言转换工具,将所述标记语言生成指定格式的报告。

具体地,电网运监数据分析报告是指,电网企业的运监中心将电网企业业务部门(例如:营销、生产,资产、运行监控等)相关的业务系统数据进行统一汇集,按照业务场景需求进行融合性交叉分析,生成评价指标分析报告。通过数据分析报告,能够及时发现运营指标缺陷,指导企业在运营层辅助决策。

本实施例中,获取模块301从电网运监中心的数据库中获取报告模板文件。其中,报告模板文件包括两部分,分别是docx、pptx内容模板文件,以及rmd格式分析报告模板文件。基于r语言编写分析处理程序,r是一种用于统计分析、绘图的语言和操作环境。包括有效的数据存储和处理功能,一套完整的数组(特别是矩阵)计算操作符,拥有完整体系的数据分析工具,为数据分析和显示提供的强大图形功能,一套完善、简单、有效的编程语言。

进一步地,转换模块302执行上述分析处理程序,结合报告模板文件的内容与格式,将报告模板文件转换为markdown格式的标记语言。其中,markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式。

markdown是一种轻量级标记语言,允许人们使用易读易写的纯文本格式编写文档,然后转换成有效的其他格式文档。

最后,报告生成模块303调用标记语言转换工具,将markdown格式的标记语言生成指定格式的报告,实现了数据分析报告的自动化生成。

本发明实施例提供的电网运监数据分析报告的自动化生成系统,基于r语言编写分析处理程序,执行分析处理程序,将所述报告模板文件转换为markdown格式的标记语言。调用标记语言转换工具,将标记语言生成指定格式的报告。本发明实现了数据分析报告的自动化生成。传统数据分析报告效率低下,耗费人力物力,本发明提高了分析效率,节约了人力成本。

在上述实施例的基础上,所述系统还包括校验模块,用于基于r语言编写数据校验程序,并根据所述数据校验程序,进行电网运监业务数据的异常性检验。

具体地,本实施例基于r语言编写数据校验程序,执行数据校验程序,进行电网运监业务数据的异常性检验,实现了电网运监数据的自动化异常性校验,与传统人工分析校验异常数据的方式相比,提高异常数据的检验效率。

在上述各实施例的基础上,所述报告生成模块303具体用于:

调用pandoc转换工具,将所述标记语言生成指定格式的报告;

其中,所述指定格式包括docx、pdf以及html。

具体地,对于markdown格式的标记语言,调用pandoc转换工具,将markdown格式的标记语言生成指定格式的报告,指定格式包括docx、pdf以及html。其中,pandoc是一种标记语言转换工具,可实现由标记输出为格式化文档,也可以进行不同标记语言间的格式转换。

对于docx、pptx格式的报告模板文件,调用reporters扩展包,将报告模板文件生成多种文件格式的报告,生成的报告包括docx文件、pptx文件,以及pdf格式的文件。

进一步地,利用数据可视化方法进行电网运监业务数据检验。数据可视化是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。数据可视化是指一种表示数据或信息的技术,它将数据或信息编码为包含在图形里的可见对象,如点、线、条等,目的是将信息更加清晰有效地传达给用户,是数据分析或数据科学的关键技术之一。简单地说,数据可视化就是以图形化方式表示数据。决策者可以通过图形直观地看到数据分析结果,从而更容易理解业务变化趋势或发现新的业务模式。使用可视化工具,可以在图形或图表上进行下钻,以进一步获得更细节的信息,交互式地观察数据改变或处理过程。

在上述各实施例的基础上,所述校验模块具体用于:

执行数据校验程序,调用机器学习模型进行电网运监业务数据的异常性检验。

图2a为根据本发明实施例提供的利用3-δ模型分析异常数据的离群的示意图;图2b为根据本发明实施例提供的利用局部回归模型分析异常数据的离群的示意图;本实施例中,调用机器学习模型进行电网运监业务数据的异常性检验,涵盖了异常数据检测、筛选与处理三个步骤。异常数据检测采用了3-δ模型,利用3-δ模型分析异常数据的离群的示意图如图2a所示。异常值处理方法采用了简单剔除与局部回归模型相结合的方法,局部回归模型如图2b所示。采用3-δ模型、箱线模型进行历史数据的异常性检验,将异常数据处理后,采用局部回归模型获得合理参数范围,返回处理后的合理数据。

本发明实施例提供的电网运监数据分析报告的自动化生成系统,基于r语言编写分析处理程序,执行分析处理程序,将所述报告模板文件转换为markdown格式的标记语言。调用标记语言转换工具,将标记语言生成指定格式的报告。本发明实现了数据分析报告的自动化生成。传统数据分析报告效率低下,耗费人力物力,本发明提高了分析效率,节约了人力成本。

最后应说明的是:以上实施例仅用以说明根据本发明实施例提供的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,对于本领域的普通技术人员而言,可以理解在不脱离根据本发明实施例提供的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,凡在根据本发明实施例提供的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在根据本发明实施例提供的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1