基于贝叶斯高斯张量分解模型的用电数据修复方法及系统

文档序号:35206280发布日期:2023-08-22 18:05阅读:30来源:国知局
本发明涉及数据修复,具体涉及一种基于贝叶斯高斯张量分解模型的用电数据修复方法及系统。
背景技术
::1、随着电力系统信息化程度的提高和智能电网的加速建设,用户电力数据量呈指数型增长状态。为了更好地服务用户以及维持国民经济的可持续发展,对配用电大数据中海量用户用电行为的分析和挖掘具有越来越重要的意义,同时海量电力用户所产生的负荷大数据也对数据修复技术提出了更加严峻的挑战。2、当前,用电信息采集系统可为多种业务提供数据支撑。但由于采集设备故障、通信信道不稳定以及外界干扰等原因,往往会出现用电信息采集系统采集到存在数据缺失的电量数据,这会造成基于电量数据的各种应用分析失去准确性甚至无法进行。因此,必须对存在数据缺失的电量数据进行修复。技术实现思路1、本发明的目的在于提供一种基于贝叶斯高斯张量分解模型的用电数据修复方法及系统,收集天气、节假日、星期类型和用电量数据,将选取的天气因素运用灰色关联度构建成天气因子,根据是否是节假日构建节假日因子,根据星期类型构建星期因子,然后构建相似度目标函数。使用改进后的野马优化算法对构建的目标函数进行寻优,从而再大量历史数据中找到相似度最高的相似日,将相似日的数据输入进贝叶斯高斯张量分解模型进行残缺数据修复。本发明采用改进的野马优化算法选择相似日,输入贝叶斯高斯张量分解模型中对残缺数据进行修复,提升修复数据准确率,以提高数据质量,提高预测精确性。2、为了实现上述目的,本发明采用的技术方案是:基于贝叶斯高斯张量分解模型的用电数据修复方法,包括以下步骤:3、步骤1:收集修复日和历史日的天气数据、是否是节假日和星期类型数据,并且收集残缺数据电表和相邻两个电表修复日和历史日的用电量数据;4、步骤2:对收集到的天气数据进行归一化处理,得到归一化天气数据;5、步骤3:将归一化天气数据运用灰色关联度构建成天气因子,根据是否是节假日构建节假日因子,根据星期类型构建星期因子,根据天气因子、节假日因子和星期因子构建相似度目标函数;使用野马优化算法对相似度目标函数进行寻优,在历史日中查找到与修复日相似度最高的m个相似日;6、步骤4:以相似度最高的m个相似日的用电量数据构成三阶张量,将三阶张量输入到贝叶斯高斯张量分解模型中进行数据修复。7、进一步优选,将修复日的归一化天气数据作为母序列,历史日的归一化天气数据作为子序列进行灰色关联度计算:8、;9、式中,为分辨系数,为修复日的第k类归一化天气数据;为第n个历史日的第k类归一化天气数据;为第n个历史日与修复日的第k类归一化天气数据之间的灰色关联度;10、将第n个历史日与修复日的各类归一化天气数据之间的灰色关联度相加,得到第n个历史日的天气因子,公式如下:,k为天气数据类别总数。11、进一步优选,节假日因子构建方式如下:12、;13、;14、式中,为第n个历史日的节假日因子,为第n个历史日与修复日的关联系数,q为修复日与第n个历史日相隔的天数;mod为取余函数;为历史日与修复日是否所处同一个节假日或者非节假日的衰减系数,;为历史日和修复日相隔每增加一天的日衰减系数,;为全年的天数。15、进一步优选,所述星期因子的构建方式如下:16、;17、式中,为第n个历史日的星期因子,,为星期衰减系数,为比例系数用来根据每个地区工作日和休息日用电量不同调整比例系数,t1为修复日星期数,t2为相似日的星期数。18、进一步优选,所述相似度目标函数为:19、;20、式中,为第n个历史日与修复日的相似度,为天气因子的权重系数,为节假日因子的权重系数,为星期因子的权重系数。21、进一步优选,所述野马优化算法流程如下:22、步骤3.5.1:创建初始种群:23、<mstyledisplaystyle="true"mathcolor="#000000"><mi>x</mi><mi>=</mi><mrow><mo>[</mo><mtablecolumnalign="left"><mtr><mtd><mi>x</mi><msub><mrow/><mi>1</mi></msub></mtd></mtr><mtr><mtd><mi>x</mi><msub><mrow/><mi>2</mi></msub></mtd></mtr><mtr><mtd><mi></mi><mi>⋮</mi></mtd></mtr><mtr><mtd><mi>x</mi><msub><mrow/><mi>i</mi></msub></mtd></mtr><mtr><mtd><mi></mi><mi>⋮</mi></mtd></mtr><mtr><mtd><mi>x</mi><msub><mrow/><mi>n</mi></msub></mtd></mtr></mtable><mo>]</mo></mrow><mi>=</mi><mrow><mo>[</mo><mtablecolumnalign="left"><mtr><mtd><mi>x</mi><munderover><mi/><mi>1</mi><mi>1</mi></munderover><mi></mi><mi>x</mi><munderover><mi/><mi>1</mi><mi>2</mi></munderover><mi></mi><mi>⋯</mi><mi></mi><mi>x</mi><munderover><mi/><mi>1</mi><mi>j</mi></munderover><mi></mi><mi>⋯</mi><mi></mi><mi>x</mi><munderover><mi/><mi>1</mi><mi>d</mi></munderover></mtd></mtr><mtr><mtd><mi>x</mi><munderover><mi/><mi>2</mi><mi>1</mi></munderover><mi></mi><mi>x</mi><munderover><mi/><mi>2</mi><mi>2</mi></munderover><mi></mi><mi>⋯</mi><mi></mi><mi>x</mi><munderover><mi/><mi>2</mi><mi>j</mi></munderover><mi></mi><mi>⋯</mi><mi></mi><mi>x</mi><munderover><mi/><mi>2</mi><mi>d</mi></munderover></mtd></mtr><mtr><mtd><mi></mi><mi>⋮</mi><mi>⤢</mi><mi>⋮</mi><mi>⤢</mi><mi>⋮</mi><mi>⤢</mi><mi>⋮</mi><mi>⤢</mi><mi>⋮</mi><mi>⤢</mi><mi>⋮</mi></mtd></mtr><mtr><mtd><mi>x</mi><munderover><mi/><mi>i</mi><mi>1</mi></munderover><mi></mi><mi>x</mi><munderover><mi/><mi>i</mi><mi>2</mi></munderover><mi></mi><mi>⋯</mi><mi></mi><mi>x</mi><munderover><mi/><mi>i</mi><mi>j</mi></munderover><mi></mi><mi>⋯</mi><mi></mi><mi>x</mi><munderover><mi/><mi>i</mi><mi>d</mi></munderover></mtd></mtr><mtr><mtd><mi></mi><mi>⋮</mi><mi>⤢</mi><mi>⋮</mi><mi>⤢</mi><mi>⋮</mi><mi>⤢</mi><mi>⋮</mi><mi>⤢</mi><mi>⋮</mi><mi>⤢</mi><mi>⋮</mi></mtd></mtr><mtr><mtd><mi>x</mi><munderover><mi/><mi>n</mi><mi>1</mi></munderover><mi></mi><mi>x</mi><munderover><mi/><mi>n</mi><mi>2</mi></munderover><mi></mi><mi>⋯</mi><mi></mi><mi>x</mi><munderover><mi/><mi>n</mi><mi>j</mi></munderover><mi></mi><mi>⋯</mi><mi></mi><mi>x</mi><munderover><mi/><mi>n</mi><mi>d</mi></munderover></mtd></mtr></mtable><mo>]</mo></mrow></mstyle>;24、;25、式中:为搜索空间中候选解的总数,即为野马的总数,d为决策变量总数, 为第个候选解,为第个候选解的第个决策变量,i=1,2,…,n;j=1,2,…,d; 是第个候选解的第个决策变量的最小边界,是第个候选解的第个决策变量的最大边界;是一个<mstyledisplaystyle="true"mathcolor="#000000"><mo>[</mo><mrow><mi>0</mi><mi>,</mi><mi>1</mi></mrow><mo>]</mo></mstyle>均匀分布的随机数;26、将初始种群分为几个小组,分组数为g=[n×ps],其中ps是种马在种群中的百分比,将其视为野马算法的控制参数,根据种群的数量,得到g个领导者,剩下的n-g个成员平均分配,在初始时随机选取各组的领导者,在后续阶段,根据成员之间的适应度选择领导者;27、步骤3.5.2:放牧行为:28、种群成员在以领导者为圆心进行中心搜索,其表达式为:29、;30、式中:为成员更新后的位置,为领导者位置,第个候选解处于初始位置,为取值[-2,2]之间的随机数,用来控制成员与领导者的角度,为自适应机制;31、;32、式中:是由0和1组成的向量,和为[0,1]空间内均匀分布的随机向量;为取值[0,1]之间的随机数,为索引,表示二进制取反;满足条件的随机向量返回索引;为自适应因子;33、;34、式中:t为迭代次数, 为最大迭代次数;35、步骤3.5.3:野马交配:离开第u个小组的野马和离开v组的野马分别加入了一个临时组,进入青春期后进行交叉;交叉后对野马子代位置进行更新;36、;37、;38、;39、;40、式中:表示下一代野马的位置,表示第u个小组内的小野马g的当前位置,表示第v个小组内的小野马的当前位置,为交叉函数,  表示父代的位置,表示母代的位置,表示全局最优个体的位置,表示父代和传给子代基因的权重比,表示母代传给子代基因的权重比;41、步骤3.5.4:团队领导:领导者的位置更新公式为:42、,43、式中:为第u个小组领导者更新后的位置,表示最优个体位置;44、步骤3.5.5:领导者选拔:45、,46、式中:为适应的函数,出现的领导者即为最优解。47、进一步优选,所述三阶张量是由三片矩阵构成,第一片矩阵为:48、;49、式中,nu为每天的采样点数,表示待修复数据的电表修复日当天的第1个采样点用电量数据,表示第m个相似日的待修复数据电表的第1个采样点用电量数据,表示待修复数据的电表修复日当天的第nu个采样点用电量数据,表示第m个相似日的待修复数据电表的第nu个采样点用电量数据,在到之间存在点缺失数据;50、第二片矩阵为:51、;52、式中,表示待修复数据电表的相邻电表a修复日当天的第1个采样点用电量数据,表示第m个相似日的待修复数据电表的相邻电表a的第1个采样点用电量数据,表示待修复数据电表的相邻电表a修复日当天的第nu个采样点用电量数据,表示第m个相似日的待修复数据电表的相邻电表a的第nu个采样点用电量数据;53、第三片矩阵为:54、;55、式中,表示待修复数据电表的相邻电表c修复日当天的第1个采样点用电量数据,表示第m个相似日的待修复数据电表的相邻电表c的第1个采样点用电量数据,表示待修复数据电表的相邻电表c修复日当天的第nu个采样点用电量数据,示为第m个相似日的待修复数据电表的相邻电表c的第nu个采样点用电量数据。56、进一步优选,所述天气数据包括最高气温、最低气温、降雨量和湿度。57、本发明还公开了用于实现基于贝叶斯高斯张量分解模型的用电数据修复方法的系统,包括数据采集模块、归一化数据处理模块、相似日计算模块和数据修复模块,数据采集模块包括天气和日期数据采集模块和电量采集装置,天气和日期数据采集模块收集修复日和历史日的天气数据、是否是节假日和星期类型数据,电量采集装置收集残缺数据电表和相邻两个电表修复日和历史日的用电量数据;归一化数据处理模块对收集到的天气数据进行归一化处理,得到归一化天气数据;相似日计算模块内置相似度目标函数和野马优化算法;数据修复模块内置贝叶斯高斯张量分解模型。58、本发明的有益效果:本发明采用改进后的野马优化算法自适应的在众多历史数据中选取综合影响用电因素相似度最高的相似日的用电数据,运用贝叶斯高斯张量分解模型对残缺数据修复,相较于已有的方案,本发明从利用了历史数据,运用改进后的野马优化算法提高了选取的相似日的准确性,并且从空间和时间两个方面考虑数据的修复,在空间上利用周围数据的信息,提高了数据修复的准确性。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1