一种家庭用电数据预测方法与流程

文档序号:12469301阅读:552来源:国知局
一种家庭用电数据预测方法与流程

本发明涉及一种数据预测方法,具体为一种家庭用电数据预测方法。



背景技术:

普通家庭用户用电数据预测是通过非侵入的方式,基于对电源总接口处测得的总用电数据的细节分析,确定单独的电器的具体工作情况。这种技术能够给普通家庭提供更加精细准确的用电消费分析服务,对能源的节省起到促进的作用。同时,分析用户的用电模式,可以探测到普通用户的隐私数据点,进而对用户的隐私进行隐藏保护,确保用户用电信息安全。

分解居民用电数据,可以更清楚的知道居民用电细节信息,对于电力公司来说,可以准确的预测出居民用电趋势,从而科学合理的保证电力资源的分配和供电工作的运行。同时,可以帮助电力公司更好的检测出不规则用电的用户和非法用电用户,识别在普通居民区隐藏的小型工商电力用户,保证电力公司的经济效益。同时,居民用电的细节可以帮助电力公司进行停电故障的检测和定位,更快的恢复供电;通过分解用户的用电数据至单一的电器,用户快速准确地检测和排除电器故障,确保用电安全。用户也可以更好的掌握自己用电的情况,提高节约意识,以高能效电器替换高能耗电器,有效节省能源。同时,电力数据分解还涉及到用户隐私的问题。电力公司在获取用户用电数据的途径中,数据很容易被不法分子截取。不法分子通过对数据的分析,可以窥探用户的隐私,进而对普通用户带来严重的危害。在数据的传输中,对数据进行加解密处理是解决这个问题的有效办法之一。但是,这种方法仍然具有隐私暴露的风险。通过对用户家庭用电数据进行分解,对涉及隐私的数据进行保护也是解决以上问题的途径之一。当单一电器的使用状态被分解出来时,对多个家庭的某种电器通过概率统计的方式,设定阈值,计算出一种通用模式,进而找出用户对某种电器使用的异常模式,对这种模式进行隐藏保护,来保护用户的隐私。例如:通过对100万户家庭用电数据进行分解,然后将结果进行概率统计得知,在周一到周五上午的9点至10点,电视机被打开的概率是10%,在晚上8点至9点电视机被打开的概率是90%,而在凌晨3点到4点被打开的概率仅有1%;某一普通用户在连续一个月的时间里其中有85%以上的时间符合正常用电模式(既晚上打开电视机),而其中有连续几天不符合正常用电模式的数据(凌晨打开电视机)即可视为隐私数据。针对这部分数据,我们可以通过多种不同的方式进行保护,确保用户隐私数据不被挖掘,且被保护过的数据保持原有特性不变,不影响数据的正常使用(如统计电费等)。这整个过程需要由计算机或智能终端实现,而不需要经过第三方角色参与;目前,普通家庭用电数据预测的方法已发展了多年。第一种用电数据分解的方法由MIT在19世纪80年代提出。这种基础的算法包括五步:第一,用边缘检测器确定用电功率的变化;第二,通过聚类分析算法在二维特征空间中聚类;第三,正负功变聚类以相似量级的方式成对匹配;第四,不被匹配的聚类根据最大似然算法与已有的聚类或新的聚类进行匹配;第五,成对的聚类结果与不同负载已知的功耗水平相比较,确定各个电器的具体运行情况。这种方法的准确度能达到70%,但是这种方法最大的问题是,当几种电器的消耗功率相似时,这几种电力可能很难被分离;之后,罗切斯特大学的两位学者提出使用高频数据的特征,如:谐波和原始波,通过一种特定电器检测规则来检测如冰箱一类的大型的电器。这个方法含蓄的通过一个评分系统使用电器打开时间统计量作为特征。与其他已经存在的方法类似,该方法需要过多的训练过程。之后,帕德博恩大学的Baranski提出了不同于MIT的方法。这种方法通过一个优化算法去最优的匹配在一定时间里存在的电器中检测到的开关事件集合,这种方法首次提出了在一段时间序列中进行优化的概念,不同于以往在单个时间点进行匹配。剑桥大学的Michael Zeifman和Kurt Roth提出使用稀疏转换的维特比算法进行状态预测,这种方法基本让重叠电器分离性能有了很大的提升,但是这种方法无法确定某个聚类具体是那种电器;研究表明,适用于智能电表的用电数据的用电数据预测方法需要满足以下几点要求:1选择的特征必须与电力数据采集系统相适应(采样频率一般低于1Hz)。2分解结果的准确性应该能被用户所接受,一般不低于80%。3方法不需要额外的训练过程,而且该算法需要能够识别新的电器和提出长时间不被使用的无效电器。4算法需要有较高的计算效率和鲁棒性。5算法的性能不能随着电器数量的增加而急剧的降低。目前,已经存在的方法虽然已经解决了上述的部分问题,但是无法满足上述的全部要求。在电器初步的聚类阶段,由于特征量太少,无法准确的聚类。用电功率近似相等的几种电器无法成功的进行分离。目前,准确最高的方法有效的将电器状态进行了识别,但是无法识别电器的种类。



技术实现要素:

本发明的目的在于提供一种家庭用电数据预测方法及其制作方法,以解决上述背景技术中提出的问题。

本发明的目的是通过下述技术方案予以实现:一种家庭用电数据预测方法,包括原始数据的采集、数据训练和特征提取以及数据的分解和分类,具体步骤如下:

(1)首先通过家用智能电表进行总功率原始数据的采集,尤其是对低频数据(1Hz)的采集,采集的数据以时间戳和功率的形式进行保存,同时对每个单一电器的数据文件中的数据也进行采集;

(2)将步骤(1)中采集的总功率原始数据进行特征提取,所述特征提取包括数据中带时间戳的正负功率变化、功率骤增量以及功率骤增持续时间,同时对每个单一电器的数据文件中采集的数据进行遍历,识别功率变化点,并统计功率变化大小和时间点,对出现功率浪涌的电器统计功率骤增值和持续时间,自动形成相应电器的特征向量进行保存,且特征向量保存形式为:(△pi,pis,ts,use);

(3)通过步骤(2)得出总功率原始数据的变化情况并记录变化点的大小和时间戳,通过负功变的聚类(聚类融合),同时将负功变与正功变匹配,进行初步的时间(电器打开和关闭)估计,然后形成正功变聚类(聚类融合),并对聚类结果统计特征,根据训练结果的特征向量进行分类,估计每一种电器的开关状态;

(a)所述总功率原始数据的变化情况通过对遍历数据文件,对相邻的功率数据进行对比,当两个数据之差大于一定阈值时,记录该差值,并记录相应时间戳。当差值为负数时,作为负向功变;当差值为正时,检测下S秒有无功率波动,若有,则记录该点为功率骤增量,并向后遍历记录持续时间;若无,记录为正向功变;

伪码如下:

(b)所述负向功变聚类通过对已经确定的负向功变进行初步聚类(可使用改进的ISODATAS算法),用使用时间等统计量信息对聚类结果进行分离和融合,减少聚类误差;在ISOSATA算法中加入时间特征,通过使用模式相似度进行聚类融合和分离,提高聚类准确度。

(c)所述改进的ISODATAS算法的首先预设聚类数,该值的选取可由生活经验可得(即普通家庭一般具有几种电器),θC为两个电器聚类中心的最小距离,若小于此值,则把两种电器合并成一种电器,NC为初始聚类中心的个数,S为预设的阈值,当sim值超过S时,认为两种电器聚类为同一种电器,对这两种聚类进行合并。

sim的计算方法如下:

记录功率变化时相应的时间戳,并计算相邻两个时间戳的差值,记录时间间隔

k=tj-tj-1,其中j=2,3,4…….

通过以下公式计算△k的标准差

其中

Compare Sim and S

(d)负功变的聚类每个聚类中的所有的负向功变与正向功变匹配,并估计打开和关闭时间,对于电器聚类i,每个已经确定的负向功率变化j的大小为△pij,发生的时间为tj,让j与发生时间为tk(tk<tj)大小为△pik的正向功变k匹配,并通过以下公式对电器打开时间和关闭时间进行估计,ton=tj-tk toff=tk+1-tj,与负向功变相匹配的正向功变被聚类为i+

(e)对上一步的每个聚类结果进行特征提取,根据训练数据中得到的每种电器的特征情况,使用简单的分类方法(如决策树)进行电器分类,识别每个聚类至具体电器;

(f)电器的分类结果融合分析:加入先验知识后,进行状态估计。(该过程可采用遗传算法、维特比算法等多种方式进一步提高分解准确度),其中单点的方法如下:在一个电器集中,把功变数据按时间顺序排序,正值表示电器被打开,负值表示电器被关闭;该过程可以对相邻的电器根据电器的状态建立成隐马尔可夫模型,用维特比算法解码,进一步对重叠电器进行分离,提高分解准确度。

本发明的有益效果是:该发明一种家庭用电数据预测方法,通过使用这种方法,可以通过对普通家庭智能电表的数据分析,预测单个电器每天不同时刻的开关状态,该方法解决了传统方法中因数据特征太少无法有效分类的问题,对用户用电情况的分析有重要的作用,基于此方法,我们继而可以通过建立用户隐私框架的方式对用户用电习惯隐私进行保护,具有深远的意义。

附图说明

图1为本发明整体流程示意图;

图2为本发明总功率原始数据采集示意图;

图3为本发明基于ISODATA算法的改进算法示意图;

图4为本发明识别具体电器原理示意图;

图5为本发明单点结果估算示意图。

具体实施方式

下面结合具体实施方式进一步的说明,但是下文中的具体实施方式不应当做被理解为对本体发明的限制。本领域普通技术人员能够在本发明基础上显而易见地作出的各种改变和变化,应该均在发明的范围之内。

实施例1

如图1所示:一种家庭用电数据预测方法,包括原始数据的采集、数据

训练和特征提取以及数据的分解和分类,具体步骤如下:

(1)首先通过家用智能电表进行总功率原始数据的采集,尤其是对低频数据(1Hz)的采集,采集的数据以时间戳和功率的形式进行保存,如图2所示,左为时间戳,右为功率。

同时对每个单一电器的数据文件中的数据也进行采集;

(2)将步骤(1)中采集的总功率原始数据进行特征提取,所述特征提取包括数据中带时间戳的正负功率变化、功率骤增量以及功率骤增持续时间,同时对每个单一电器的数据文件中采集的数据进行遍历,识别功率变化点,并统计功率变化大小和时间点,对出现功率浪涌的电器统计功率骤增值和持续时间,自动形成相应电器的特征向量进行保存,且特征向量保存形式为:(△pi,pis,ts,use);

(3)通过步骤(2)得出总功率原始数据的变化情况并记录变化点的大小和时间戳,通过负功变的聚类(聚类融合),同时将负功变与正功变匹配,进行初步的时间(电器打开和关闭)估计,然后形成正功变聚类(聚类融合),并对聚类结果统计特征,根据训练结果的特征向量进行分类,估计每一种电器的开关状态;

(a)所述总功率原始数据的变化情况通过对遍历数据文件,对相邻的功率数据进行对比,当两个数据之差大于一定阈值时,记录该差值,并记录相应时间戳。当差值为负数时,作为负向功变;当差值为正时,检测下S秒有无功率波动,若有,则记录该点为功率骤增量,并向后遍历记录持续时间;若无,记录为正向功变;

伪码如下:

(b)所述负向功变聚类通过对已经确定的负向功变进行初步聚类(可使用改进的ISODATAS算法),用使用时间等统计量信息对聚类结果进行分离和融合,减少聚类误差;在ISOSATA算法中加入时间特征,通过使用模式相似度进行聚类融合和分离,提高聚类准确度。

(c)基于ISODATA算法的改进算法如图3所示:

所述改进的ISODATAS算法的首先预设聚类数,该值的选取可由生活经验可得(即普通家庭一般具有几种电器),θC为两个电器聚类中心的最小距离,若小于此值,则把两种电器合并成一种电器,NC为初始聚类中心的个数,S为预设的阈值,当sim值超过S时,认为两种电器聚类为同一种电器,对这两种聚类进行合并。

sim的计算方法如下:

记录功率变化时相应的时间戳,并计算相邻两个时间戳的差值,记录时间间隔

k=tj-tj-1,其中j=2,3,4…….

通过以下公式计算△k的标准差

其中

Compare Sim and S

(d)负功变的聚类每个聚类中的所有的负向功变与正向功变匹配,并估计打开和关闭时间,对于电器聚类i,每个已经确定的负向功率变化j的大小为△pij,发生的时间为tj,让j与发生时间为tk(tk<tj)大小为△pik的正向功变k匹配,并通过以下公式对电器打开时间和关闭时间进行估计,ton=tj-tk toff=tk+1-tj,与负向功变相匹配的正向功变被聚类为i+

(e)对上一步的每个聚类结果进行特征提取,根据训练数据中得到的每种电器的特征情况,使用简单的分类方法(如决策树)进行电器分类,识别每个聚类至具体电器,如下原理图为;

(f)电器的分类结果融合分析:加入先验知识后,进行状态估计。(该过程可采用遗传算法、维特比算法等多种方式进一步提高分解准确度),

其中单点的方法如下:在一个电器集中,把功变数据按时间顺序排序,正值表示电器被打开,负值表示电器被关闭;该过程可以对相邻的电器根据电器的状态建立成隐马尔可夫模型,用维特比算法解码,进一步对重叠电器进行分离,提高分解准确度。估计结果如图5所示:其中,2代表打开状态1 代表关闭状态。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1