本发明属于变压器状态监测技术领域,涉及一种变压器状态参量组合预测方法,特别涉及一种基于云系相似度权重分配的变压器状态参量组合预测方法。
背景技术:
状态参量在线监测是开展变压器状态监测的重要基础。然而,目前变压器状态参量在线监测离变压器全面状态检修的实现尚有差距,其中一个重要原因是不能随时获得准确的状态参量数值。根据己有的状态参量数值预测其变化,是变压器状态在线监测中十分重要且必要的补充,也是预警变压器故障的重要手段。其意义在于,通过预测变压器状态参量变化,就能够应用各故障分析技术提前对变压器的绝缘状况做出诊断,并以此对变压器进行跟踪和安排检修,能够减少事故发生,保证电力系统的安全稳定运行。
目前,典型的预测方法包括滑动平均模型、神经元网络、函数逼近、遗传规划、最小二乘支持向量机等。然而,变压器状态参量时间序列数据的高随机性意味着无法使用单一模型完成时序数据序列的预测,即各模型存在各自最优适配情况。根据时间序列不同的分布特性设计或选择合适的模型进行拟合是重要的研究点。考虑到既定模型对数据形式的敏感性,有必要研究针对时序数据序列的新的组合预测方法,即获取多个预测模型针对同一原始序列的预测结果,并根据不同表征算法涉及的相似度评价方法对上述预测结果进行评价,择优或组合选择若干预测模型,最大化组合预测模型的拟合精度。
线性组合预测是一类较为常用的建模方式,其目标是通过统计学分析或优化方法确定各独立模型预测结果所占权重,并采用线性加权累加方式得到最终组合预测结果。这种方法主要依据独立模型预测精度确定其权重占比,并未考虑不同独立模型预测时序流的分布特性与形状信息,而这些信息往往隐含着不同模型针对同一数据模式的不同反馈特性。
综上,亟需一种新型的变压器状态参量组合预测方法。
技术实现要素:
本发明的目的在于提供一种基于云系相似度权重分配的变压器状态参量组合预测方法,以解决由于变压器状态参量时间序列数据的高随机性导致无法获取单一最优适配预测模型的问题。
为达到上述目的,本发明采用以下技术方案:
一种基于云系相似度权重分配的变压器状态参量组合预测方法,包括以下步骤:
s1,采集获取变压器运行产生的状态参量时序数据,构成原始时序数据流x;
s2,将步骤s1获得的原始时序数据流x划分为训练集xtr、验证集xva以及测试集xte,并利用训练集xtr构造独立模型训练元组ω={u,v};
s3,利用步骤s2构造的训练元组ω={u,v}对m个预选定的独立预测模型进行训练,获取训练后的m个独立预测模型对于验证集xva的预测结果
s4,对验证集xva及其预测结果
s5,计算步骤s4获得的两云系相同位置云模型间的重叠面积以得到其相似度,进而计算得到云系间整体相似度;
s6,依据步骤s5获得的云系间整体相似度向各独立预测模型分配预测权重,结合步骤s3获得的预测结果
本发明的进一步改进在于,步骤s1中所述的原始时序数据流x:其大小为d×1,其中d表示数据流长度。
本发明的进一步改进在于,步骤s2中训练集、验证集及测试集的表达式分别为:xtr=[x1,x2,...,xd-2τ],xva=[xd-2τ+1,xd-2τ+2,...,xd-τ]及xte=[xd-τ+1,xd-τ+2,...,xd];其中,窗宽τ定义了各序列长度;
步骤s2中利用训练集xtr构造的独立模型训练元组ω={u,v}的表达式为:
ω={(u1,v1),(u2,v2),...,(ud-2τ-m,vd-2τ-m)};
m为嵌入维度;u和v分别为输入元和输出元,表达式分别为:
本发明的进一步改进在于,步骤s3中,验证集xva的预测结果
其中,
本发明的进一步改进在于,步骤s4中,对xva及
γ={z1,...,zj}={(z1,z2,...,zτ/j),(zτ/j+1,zτ/j+2,...,z2τ/j),...,(z(j-1)τ/j+1,z(j-1)τ/j+2,...,zτ)}1<j<λ
其中,λ为τ对3的模。
本发明的进一步改进在于,步骤s4中的反向正太云发生器表示为:
其中,l表示时间序列段zi,i=1...j的长度。
本发明的进一步改进在于,步骤s5中,两云系相同位置云模型间重叠面积的计算公式表示为:
令vt~(ext,ent,het)和
其中,
vt和
云系整体相似度的计算公式为:
本发明的进一步改进在于,步骤s6中,依据云系间整体相似度向各独立预测模型分配预测权重的计算公式为:
其中,si表示xva与
本发明的进一步改进在于,步骤s6中,结合预测结果
其中,w=[ω1,ω2,...,ωm]t为计算所得权值所构成的矩阵。
本发明的进一步改进在于,步骤s1中,状态参量时序数据为变压器油中溶解气体监测数据;步骤s3中,独立预测模型包括ann、arima和lssvm。
与现有技术相比,本发明具有以下有益效果:
本发明提出的基于云系相似度权重分配的变压器状态参量组合预测方法,结合了多个不同类别的独立预测模型,独立模型预测结果将被转化为云系以提取其局部分布特性,从而对独立预测模型结果进行准确评估并分配动态权重,使得组合预测模型拥有更高的预测精度,故本发明相比传统依据单一模型的参量预测方法而言有更高的预测精度与容错率。具体表现为,目前现有的参量组合预测方法主要依据独立模型预测精度确定其权重占比,并未考虑不同独立模型预测时序流的分布特性与形状信息。本发明提出的组合预测方法,通过将独立模型预测结果转化为云系从而充分提取了其全局与局部分布特征性,准确获取并结合了不同模型针对同一数据模式的不同反馈特性,能够充分结合各模型优势,使得组合预测模型拥有更高的预测精度。本发明的方法,可对具有高随机性特性的变压器状态参量时间序列数据进行较精确预测。
附图说明
图1为本发明实施例的一种基于云系相似度权重分配的变压器状态参量组合预测方法的流程示意图;
图2为本发明的实施例中归一化处理后的原始数据流示意图;图2(a)为h2示意图,图2(b)为ch4示意图;图2(c)为c2h6示意图,图2(d)为c2h4示意图,图2(e)为c2h2示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细说明。
请参阅图1,本发明的一种基于云系相似度权重分配的变压器状态参量组合预测方法,包括以下步骤:
1)收集变压器运行产生的状态参量时序数据构成原始时序数据流x。
步骤1)中的所述的原始时序数据流x:其大小为d×1,其中d表示数据流长度。
2)将原始时序数据流x划分为训练集xtr、验证集xva以及测试集xte,并利用训练集xtr构造独立模型训练元组ω={u,v}。
步骤2)中的训练集、验证集及测试集可进一步表示为:xtr=[x1,x2,...,xd-2τ],xva=[xd-2τ+1,xd-2τ+2,...,xd-τ]及xte=[xd-τ+1,xd-τ+2,...,xd]。其中,窗宽τ定义了各序列长度。
步骤2)中利用训练集xtr构造独立模型训练元组ω={u,v}可进一步表示为:ω={(u1,v1),(u2,v2),...,(ud-2τ-m,vd-2τ-m)},u和v分别为输入元和输出元,m为嵌入维度。
3)利用构造的训练元组ω={u,v}对预设定的m个独立预测模型进行训练,并获取训练后的m个模型对于验证集xva的预测结果
步骤3)中利用元组ω={u,v}对m个独立预测模型进行训练并获取的m个模型对于验证集xva的预测结果
4)对xva及
步骤4)中对xva及
γ={z1,...,zj}={(z1,z2,...,zτ/j),(zτ/j+1,zτ/j+2,...,z2τ/j),...,(z(j-1)τ/j+1,z(j-1)τ/j+2,...,zτ)}1<j<λ
其中,λ为τ对3的模。
步骤4)中的反向正太云发生器可进一步描述为:
其中,l表示时间序列段zii=1...j的长度。利用上述反向正态云发生器将步骤4)中的序列段zii=1...j转化为一系列云模型,从而将xva及
5)计算步骤4)获得的两云系相同位置云模型间的重叠面积以得到其相似度,进而得到云系间整体相似度。
具体的,步骤5)中两云系相同位置云模型间重叠面积的计算公式可表示为:
令vt~(ext,ent,het)和
vt和
vt和
6)依据云系间整体相似度向各独立模型分配预测权重,结合预测结果
具体的,步骤6)中依据云系间整体相似度向各独立模型分配预测权重的计算公式如下:
其中,si表示xva与
步骤6)中结合预测结果
其中,w=[ω1,ω2,...,ωm]t为计算所得权值所构成的矩阵。
综上,本发明提出的组合预测方法通过将独立模型预测结果转化为云系从而充分提取了其全局与局部分布特征性,准确获取并结合了不同模型针对同一数据模式的不同反馈特性,充分结合各模型优势,使得组合预测模型拥有更高的预测精度,可针对性用于变压器状态参量时间序列数据的精确预测。
实施例
请参阅图1和图2,本发明提出的组合预测方法主要包含以下几个步骤:
一、数据导入与预处理。
仿真实验的数据采用变压器色谱在线监测系统采集的五类变压器油中溶解气体监测数据,即h2,ch4,c2h6,c2h4及c2h2,数据流长度d均为150,经归一化处理后的原始数据如图2所示。本实施例中,窗宽τ取值为20。以下均以针对h2时序数据流的预测为例对算法执行流程进行描述,因此训练集、验证集及测试集可进一步表示为xtr=[x1,...,x110],xva=[x111,...,x130]及xte=[x131,...,x150]。
根据原始数据分布特性,嵌入维度m选择为8。随后便可利用训练集并根据不同的嵌入维度m及数据流长度d构造训练元组ω。则ω={u,v}可具体表示为:
二、独立模型预测结果获取。
独立预测模型的选择在很大程度上决定了组合预测结果的好坏。经过对大量预测模型的测试,本例中最终选择了三个被广泛认可的独立模型,分别为人工神经网络(ann)、整合移动平均自回归模型(arima)以及最小二乘支持向量机(lssvm)。需注意的是,本发明所提出的组合预测方法对独立模型个数及类型并无限制,可针对实际问题进行相应调整。
确定独立预测模型后,便可利用所构造的训练元组对其进行训练获取独立模型建模所需参数。需注意的是,独立模型参数的确定方法不在本发明内容的讨论范围内且为该领域研究人员所明确的技术手段。本例中为方便起见仅给出实验中不同数据集下三个独立预测模型所需参数的具体数值,如表1所示,对其计算过程不作详细描述。
表1三个独立预测模型所需参数的具体数值
随后便可利用训练后的独立模型获取对验证集xva及测试集xte的预测结果。
三、正态云系构造。
该部分以ann对h2时序数据流的预测结果为例,对算例后续部分进行描述。
接下来需对xva及
随后便可利用下述公式:
将z1,z2及
四、云系相似度计算。
随后便可利用下述公式计算两云系相同位置云模型间重叠面积δ1及δ2。
则z1与
云系γ_xva及
同样的,可根据上述流程计算得到γ_xva与
五、权值分配与组合预测。
随后,便可利用下述公式向各独立模型分配预测权重:
最后,结合预测结果
为进一步评价本发明提出方法的组合预测结果,实验过程中将本发明方法所得结果与独立模型预测结果、现有的先进组合预测方法与传统组合预测方法结果相对比,如表2所示。评价指标选择平均绝对误差(mae)与均方根误差(rmse),上述指标的计算公式如下
表2预测结果对比
由实验结果可见,对于独立预测模型而言,由于模型既定形式的影响使得其针对不同数据集的预测性能有较大差异。而本发明方法充分结合了各模型处理不同数据分布形式时的非显著性优势,从而使得预测精度大幅提升。由评价指标也可见,本发明方法针对不同数据集时的mae及rmse相比独立观测模型均有大幅下降。此外,相比文献以及传统组合预测方法主要依据独立模型预测精度确定其权重占比,并未考虑不同独立模型预测时序流的分布特性与形状信息。而本发明提出的组合预测方法通过将独立模型预测结果转化为云系从而充分提取了其全局与局部分布特征性,准确获取并结合了不同模型针对同一数据模式的不同反馈特性,充分结合各模型优势,使得组合预测模型拥有更高的预测精度。
综上所述,本发明的变压器状态参量组合预测方法中,独立模型预测结果将被转化为云系以提取其局部分布特性,从而可对独立预测模型结果进行准确评估并分配动态权重,能够使得组合预测模型拥有更高的预测精度。考虑到变压器状态参量时间序列数据的高随机性特性,本发明可针对性用于对其的精确预测。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定专利保护范围。