本发明涉及电网数据分析领域,具体是涉及一种电网数据挖掘分析平台及其实现方法。
背景技术:
随着社会和科技的发展,电力系统从独立的,封闭的“发-用”树形结构演变成为社会化的网络结构,电力系统的社会化,电力资源共享性是现代电力系统形成的根本原因,也是区别于传统的狭义的电力系统的关键所在,未来的电力系统具有信息量巨大且相互交织,具强非线性,变参数,多随机,多噪音,自组织的临界动力学特性。数据挖掘的典型算法已经在电网各业务场景中得到了广泛应用,比较熟知的包括有电网负荷预测、用电信息管理、用电满意度评估、设备状态监测等相关方面,也取得了一定的应用效果。
但是目前这些数据挖掘分析平台均是针对某一个场景的应用。电力系统业务场景众多,如果针对不同的业务场景设计不同的数据挖掘平台,不仅操作复杂、增加研发成本,而且也加大了业务人员的学习压力。因此,构建一个综合平台,将成熟的数据挖掘原型集成,并与业务应用场景进行结合是当前需要解决的问题。
技术实现要素:
为解决现有技术的不足,本发明的目的在于提出一种高稳定性、自愈性、鲁棒性强的电网数据挖掘分析平台及其实现方法。
为了实现上述目标,本发明采用如下的技术方案:一种电网数据挖掘分析平台,该电网数据挖掘分析平台包括:表现层、控制层和数据层;
所述表现层采用b/s模式,通过jsp、ajax、jquery技术实现,供第三方交互;
所述控制层采用java语言实现,为表现层提供java类及方法调用;
所述数据层采用java语言开发,采用jdbc数据库访问技术实现,支持对数据库访问,并对控制层提供数据访问接口。
优选地,所述电网数据挖掘分析平台包括模型构建模块和模型管理模块,所述模型构建模块和模型管理模块,采用restwebservice技术实现,以方便第三方系统调用。
优选地,所述模型构建模块包括拖、拉、拽流程化的数据挖掘建模过程,模型可视化展现,与第三方系统进行界面集成。
优选地,所述模型管理模块包括模型在线测试、定时任务、版本管理、权限管理、服务集成模块。
优选地,所述数据层中的数据源包括支持文件数据源、数据库数据源。
对应地,本发明还提出了一种电网数据挖掘分析平台的实现方法,该平台中包括表现层、控制层和数据层,步骤包括:
表现层采用b/s模式,通过jsp、ajax、jquery技术实现,供第三方交互;
控制层采用java语言实现,为表现层提供java类及方法调用;
数据层采用java语言开发,采用jdbc数据库访问技术实现,支持对数据库访问,并对控制层提供数据访问接口。
优选地,所述电网数据挖掘分析平台包括模型构建模块和模型管理模块,所述模型构建模块和模型管理模块,采用restwebservice技术实现,以方便第三方系统调用。
优选地,所述模型构建模块包括拖、拉、拽流程化的数据挖掘建模过程,模型可视化展现,与第三方系统进行界面集成。
优选地,所述模型管理模块包括模型在线测试、定时任务、版本管理、权限管理、服务集成模块。
优选地,所述数据层中的数据源包括支持文件数据源、数据库数据源。
优选地,所述数据挖掘的步骤包括:
步骤s1:用户开始;
步骤s2:进行信息收集;
步骤s3:数据挖掘流程;
步骤s4:模型评估;
步骤s5:知识展示;
步骤s6:结束。
与现有技术相比,本发明的有益效果是:本发明提供一种电网数据挖掘分析平台及其实现方法,各模块均已组件服务的方式发布,采用b/s架构,具有很好的可移植性,并且集成多种成熟的数据挖掘产品,支持多种数据文件、主流数据库,提供在线建模、模型管理、模型发布等数据挖掘综合管理功能,正满足电网实际业务需要,极大提升了应用对口度,结合电网业务应用场景的数据进行建模与分析,实现基于数据为驱动的高级应用,利用数据挖掘手段实现对于海量生产数据的知识提取,为电网业务人员提供趋势分析,风险预测,发现电网结构薄弱环;并解决了传统数据挖掘分析平台应用场景的单一性的问题,实现平台一体化,降低了研发和学习成本。
附图说明
图1是本发明数据挖掘分析平台结构图。
图2是本发明数据挖掘分析平台的数据挖掘流程图。
图3是本发明话务量预测分析数据挖掘流构建图。
图4是本发明数据挖掘分析平台部署架构图。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
如图1所示,本发明提出了一种电网数据挖掘分析平台,该电网数据挖掘分析平台包括:表现层、控制层和数据层;其中表现层采用b/s模式,通过jsp、ajax、jquery技术实现;控制层采用java语言实现,为表现层提供java类及方法调用,实现平台功能;数据层采用java语言开发,采用jdbc数据库访问技术实现,支持对数据库访问,并对控制层提供数据访问接口。
结合图1所示,数据层中的数据源包括文件数据源,数据库数据源,例如支持excel、csv文件、数据库,数据库类型例如包括oracle,mysql等。
可理解的是,控制层为整个数据挖掘过程,包括数据准备,准备过程例如为数据预处理:对数据清洗、转化、平衡、匿名化等;建立与发布挖掘模型,包括选择挖掘方法建立挖掘模型;评估与知识输出,可视化展现等,这里的可视化展现是指模型训练结果。
表现层包括用户交互界面,是指用户通过浏览器与电网数据挖掘分析平台进行交互,用户主要分为3种:模型分析人员:负责流程的建模和平台应用程序的开发人员;系统管理员:对角色和用户的权限进行配置的人员;普通用户:即平台的终使用用户,通过浏览器界面完成日常的工作。
在一个具体的实施例中,电网数据挖掘分析平台包括模型构建模块和模型管理模块,两者均采用restwebservice技术实现,且均以组件服务的方式发布,以方便第三方系统调用。
其中,模型构建模块包括拖、拉、拽流程化的数据挖掘建模过程,模型可视化展现,持与第三方系统进行界面集成。模型管理模块包括模型在线测试、定时任务、版本管理、权限管理、服务集成功能等。
对应地,本发明还提出了一种电网数据挖掘分析平台的实现方法,包括表现层、控制层和数据层,方法包括:
表现层采用b/s模式,通过jsp、ajax、jquery技术实现,供第三方交互;
控制层采用java语言实现,为表现层提供java类及方法调用;
数据层采用java语言开发,采用jdbc数据库访问技术实现,支持对数据库访问,并对控制层提供数据访问接口。
请结合图2所示,该电网数据挖掘分析平台的数据挖掘流程包括:
步骤s1:用户开始后;步骤s2:进行信息收集,进入步骤s3:数据挖掘流程;其中,数据挖掘过程中包括数据的集成、数据规约、数据清理、数据变换等;进行步骤s4:模型评估;转入步骤s5:知识展示;直至步骤s6:结束。
结合图3所示,在一个具体的话务量预测分析数据挖掘流构建流程中,首先根据行业内的实践经验,结合对模型算法的研究,选择适当的算法,此应用场景选择时间序列算法,然后创建挖掘流程。
首先,确定时间跨度:确定话务量输入到时间序列算法中的时间跨度;
数据预处理:进行数据替换,包括将对空值数据替换为零。
数据读取:进行属性选择,指定因变量,获取需要进行时间序列分析的话务量数据;
时间序列分析:采用sarima算法进行时间序列分析,得到时间序列模型对数据进行建模生成模型,例如sarima模型;
结果预测:将话务量数据输入建模生成的模型中,进行话务量预测。数据分析人员生成模型后,可将模型发布到模型管理模块,例如以表的形式发布或展示,普通用户进行去操作时即可直接使用,无需关注模型构建流程,提高用户调用速度。
请参考图4,该电网数据挖掘分析平台部署架构中包括用户终端,用户终端连接主用服务器或备用服务器,主用服务器与应用服务器(应用服务器1-n)之间交互,应用服务器与算法服务请求算法调度服务器之间交互,算法服务请求算法调度服务器调用算法服务器1-n中的任意一个或多个。可理解的是,数据挖掘平台算法服务以restwebservice部署,电网数据挖掘分析平台及其算法服务和应用服务可独立部署在一台服务器,亦可集群部署在多台服务器,其中,电网数据挖掘分析平台与算法服务、应用服务相对独立。例如,算法服务包括控制层的数据挖掘,应用服务包括用户通过浏览器与电网数据挖掘分析平台进行交互。也就是说,数据挖掘端、用户应用端与电网数据挖掘分析平台可以集成在一台服务器,也可以部署在多台服务器,但是相互之间是独立的。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。