
[0001]
本发明属于变压器故障诊断技术领域,具体涉及一种基于深度学习模型的变压器故障诊断方法。
背景技术:[0002]
随着经济水平的不断提高,我国电力系统得到了空前的发展,电网规模不断扩大,变电站数目成倍增加,对电力系统的安全可靠运行也提出了更大的挑战。电力系统如果发生故障或者大规模停电,将会造成巨大的经济损失,而且还会危害公共安全,带来严重的社会影响。作为电力系统的核心元件,变压器将发电厂发出的电能升高电压传输到电网当中,同时又将电网的高电压降至额定电压输送给用户。同时,它还负责主干网架之间电压等级的变化,是区域电网互联的主要联络工具,因此其运行状态的好坏对于整个电力系统的安全稳定运行具有决定作用。
[0003]
变压器故障诊断技术能提升变压器健康水平,对电网安全稳定运行意义重大。目前,有许多学者提出了变压器的故障诊断方法,例如卷积神经网络、支持向量机、循环神经网络等等。赵文清等人提出了一种基于改进主成分分析法的变压器潜伏故障诊断策略。杨廷方等人提出采用bp神经网络对电力变压器溶解气体以及故障特点进行学习,构建诊断模型。上述变压器故障诊断模型需要大量样本进行训练,才能获取较为准确的故障诊断模型。然而,在实际工程应用中,变压器故障诊断的样本数量往往偏小。如果样本数量太少,利用上述方法构建故障诊断模型将无法独立完成深层次的特征提取,同时易出现陷入局部最优解、识别精度较低和泛化能力较弱等问题。因此如何克服现有技术的不足是目前变压器故障诊断技术领域亟需解决的问题。
技术实现要素:[0004]
本发明的目的是为了解决现有技术的不足,提供一种基于深度学习模型的变压器故障诊断方法。
[0005]
为实现上述目的,本发明采用的技术方案如下:
[0006]
基于深度学习模型的变压器故障诊断方法,包括如下步骤:
[0007]
步骤(1),故障样本的数据采集:采集故障样本,将故障样本划分为训练样本集合和测试样本集合;所述的故障样本包括变压器故障类型和油中溶解的h2、ch4、c2h6、c2h4、c2h2的含量;
[0008]
步骤(2),创建基于dbn的故障诊断模型:故障诊断模型中输入为油中溶解的h2、ch4、c2h6、c2h4、c2h2的含量;输出为故障类型;
[0009]
设置rbm层数和每层rbm的节点数;
[0010]
设rbm是由1个可见层v和1个隐含层h组成的双层网络,其中,v=[v1,v2,...,v
n
],为可见层单元的n个输入节点;h=[h1,h2,...,h
m
],为隐含层单元的m个输出节点;w=[w
ij
]
n
×
m
,为输入层到输出层的连接权值矩阵,其中i=1,2,...,n且j=1,2,...,m;a=[a1,
a2,...,a
n
],其中a
i
为第i个可见单元v
i
的偏置;b=[b1,b2,...,b
m
],其中b
j
为第j个隐含单元h
j
的偏置;
[0011]
步骤(3),模型预训练:将训练样本集导入步骤(2)的模型中,从下而上逐层训练各层rbm,获得各层rbm的初始化参数w
ij
、a
i
、b
j
;
[0012]
步骤(4),模型微调:采用bp神经网络算法反向调整预训练参数,得到最终的dbn故障诊断模型;其中,预训练参数是指各层rbm的初始化参数w
ij
、a
i
、b
j
;
[0013]
步骤(5),在线故障识别:将变压器实时运行数据导入最终的dbn故障诊断模型,进行故障识别。
[0014]
进一步,优选的是,步骤(1)中,训练样本集合和测试样本集合的样本数量比例设置为9:1。
[0015]
进一步,优选的是,步骤(1)中,故障类型分为五种:铁芯接地、线圈故障、裸金属过热、围屏放电、匝绝缘损伤。
[0016]
进一步,优选的是,步骤(2)中,设置rbm层数为5和每层rbm的节点数为10。
[0017]
进一步,优选的是,步骤(3)中,模型预训练的具体方法为:
[0018]
步骤(3.1):输入训练样本v
i
,设置学习率μ、训练次数t和允许的重构误差阈值r,同时对参数θ={w
ij
,a
i
,b
j
}进行初始化处理;
[0019]
步骤(3.2):选取1个训练样本v
i
,采用式(7)计算p(h
j
=1|v),并根据该分布采样1个隐含层向量h,然后计算正向梯度<v
i
h>;
[0020][0021]
正向梯度的计算方法如下:
[0022][0023]
σ表示激活函数;
[0024]
步骤(3.3):基于隐含层向量h,采用式(8)计算p(v
i
=1|h),记作v
i1
;
[0025][0026]
步骤(3.4):基于v
i1
重复步骤(3.2),获得新的隐含层向量h,记作h1,然后计算反向梯度<v
i1
h1>;
[0027][0028]
步骤(3.5):按照式(10)~式(12)更新各项参数,记作w
′
ij
,a
′
i
,b
′
j
:
[0029]
w
′
ij
=w
ij
+prob(<v
i
h>-<v
i1
h1>)
ꢀꢀꢀ
(10)
[0030]
a
′
i
=a
i
+μ|v
i-v
i1
|
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0031]
b
′
j
=b
j
+μ|h
j-h
j-1
|
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0032]
prob表示0或1的随机数;
[0033]
步骤(3.6):重复以上步骤(3.2)到步骤(3.5),计算新的训练样本v
i2
,v
i3
,
…
,v
it
和
新的隐含层向量h2,h3,
…
,h
t
,其中t为当前的训练次数,然后计算重构误差r=||v
it-v
i
||。当t达到最大训练次数t
max
或r小于重构误差阈值r时,停止训练。
[0034]
进一步,优选的是,学习率μ取值为98%;训练次数选择450次;允许的重构误差阈值r取0.98。
[0035]
进一步,优选的是,步骤(4)中,反向调整预训练参数的方法为:将反向计算获得的参数与初始化参数求算数平均值。
[0036]
进一步,优选的是,步骤(4)中,建立最终的dbn故障诊断模型后,还包括测试变压器故障诊断模型的性能步骤,具体为:将测试样本集合导入步骤(4)得到的故障诊断模型中,进行故障预测和实际工况对比,从而评估该故障诊断模型的性能。
[0037]
本发明初始化处理在训练开始的时候,可以参照其他模型进行初步取值;也可以都设置为1。
[0038]
本发明中σ表示激活函数,sigmoid函数在信息科学中,由于其单增以及反函数单增等性质,sigmoid函数常被用作神经网络的激活函数,将变量映射到0,1之间,其表达为:
[0039][0040]
本发明反向调整的目的是以期提高参数的准确度和适应性。
[0041]
本发明采用深度信念网络,这是由于深度信念网络(deep belief network,dbn)是深度学习模型中常用的一种概率生成模型,其在小数据样本下更容易捕捉数据特征,具有较强的自主提取特征能力和较高的目标识别精度。与卷积神经网络算法相比,dbn具有训练样本量小、操作灵活简单、与其他算法兼容性好等优点。
[0042]
本发明与现有技术相比,其有益效果为:
[0043]
本发明在小数据样本下更容易捕捉数据特征,具有较强的自主提取特征能力和较高的目标识别精度。与卷积神经网络算法相比,dbn具有训练样本量小、操作灵活简单、与其他算法兼容性好等优点。而变压器故障恰好具备小数据样本的特征,因此将dbn用于变压器的故障诊断。通过实验得出,本发明所提变压器故障诊断模型rbm-t平均准确率均高于94%。
附图说明
[0044]
图1为限制性玻尔兹曼机的结构示意图。
具体实施方式
[0045]
下面结合实施例对本发明作进一步的详细描述。
[0046]
本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用材料或设备未注明生产厂商者,均为可以通过购买获得的常规产品。
[0047]
1深度学习模型之限制性玻尔兹曼机(rbm)
[0048]
深度信念网络(deep belief network,dbn)是深度学习模型中常用的一种概率生成模型。深度信念网络由多层限制性玻尔兹曼机(restricted boltzmann machine,rbm)堆
叠而成,每层rbm通过调整神经元之间的权值,即可使整个神经网络按照最大概率来生成训练数据,从而进行特征提取和目标识别。典型的rbm结构是由1个可见层v和1个隐含层h组成的双层网络,如图1所示。可见层用于接收输入数据,隐含层用于提取数据特征,可见层神经元与隐含层神经元相互连接,而各层内的神经元则相互独立。
[0049]
图1中,v=[v1,v2,...,v
n
],为可见层单元的n个输入节点;h=[h1,h2,...,h
m
],为隐含层单元的m个输出节点;w=[w
ij
]
n
×
m
,为输入层到输出层的连接权值矩阵,其中i=1,2,...,n且j=1,2,...,m;a=[a1,a2,...,a
n
],其中a
i
为第i个可见单元v
i
的偏置;b=[b1,b2,...,b
m
],其中b
j
为第j个隐含单元h
j
的偏置。
[0050]
对于给定的可见层输入v和隐含层输出h,限制性玻尔兹曼机的能量函数e(v,h|θ)为
[0051][0052]
式中:θ={w
ij
,a
i
,b
j
},为rbm模型的参数集合。
[0053]
能量函数e(v,h|θ)可以视为在当前可见层和隐含层的节点分布状态下,每个可见节点和隐含节点之间的能量值。假设可见层和隐含层的每个节点均有0和1这2种状态,所以可见层和隐含层节点可以组成t=2
n+m
种状态对。对能量函数进行指数化和正则化处理,即可得到可见层和隐含层节点集合{v,h}分别处于某一种状态对下的联合概率分布p(v,h|θ),得
[0054][0055]
式中,为归一化因子(也称为配分函数),表示可见层和隐含层节点中所有可能状态对的总和。
[0056]
根据式(2),理论上可以获得任意一种状态下的联合概率分布p(v,h),然而z的计算难度非常大,所以通过吉布斯采样的方法来近似求解联合概率分布。通过对隐含层h中m个节点的所有二值状态进行求和,即可获得可见层v节点集合的边缘概率分布p(v),即
[0057][0058]
同理,隐含层h的边缘概率分布p(h)为
[0059][0060]
边缘分布被称为似然函数,例如p(h)隐含层节点集合处于某一种状态分布下的概率。根据p(h),即可求得可见层的条件概率分布p(v|h):
[0061][0062]
同理,隐含层的边缘概率分布p(h|v)为
[0063][0064]
根据rbm层内无连接、层间全连接的结构特点,对于给定的可见单元状态v,通过隐含层的条件概率分布函数p(h|v),即可得出第j个隐含单元的激活概率p(h
j
=1|v):
[0065][0066]
对于给定的隐含单元状态h,第i个可见单元的激活概率为p(v
i
=1|h):
[0067][0068]
σ表示激活函数;
[0069]
2 rbm模型参数的求解
[0070]
求解rbm模型时,需要确定2部分参数:一是可见层和隐含层的节点数量,二是模型参数θ。可见层的节点数量即为输入数据样本矩阵的维数,隐含层的节点数量根据实际工况而定,通常选取5-15个节点,本实验中可见层的节点数量、隐含层的节点数量均选取12个。至于模型参数θ,当给定训练样本v=[v1,v2,...,v
n
]之后,训练一个rbm模型的意义就在于不断调整模型参数θ,从而使rbm可见层节点的概率分布尽可能与输入数据相吻合。
[0071]
本发明求解最优问题时,引入似然函数(边缘概率分布p(v))求导的方法。
[0072]
由式(6)可知,能量e和概率p(v)成反比,所以通过求解最大化p(v),即可令能量e最小。最大化似然函数采用梯度上升法,故按照以下公式调整模型参数θ,即
[0073][0074]
式中:θ
′
为调整更新之后的θ参数值;μ为学习率。
[0075]
采用对比散度(cd-k)方法来近似求解参数梯度,具体流程如下:
[0076]
步骤1:输入训练样本v
i
,设置学习率μ、训练次数t和允许的重构误差阈值r,同时对参数θ={w
ij
,a
i
,b
j
}进行初始化处理。优选学习率μ取值为98%;训练次数选择450次;允许的重构误差阈值r取0.98,初始化均设置为1;
[0077]
步骤2:选取1个训练样本v
i
,采用式(7)计算p(h
j
=1|v),并根据该分布采样1个隐含层向量h,然后计算正向梯度<v
i
h>;
[0078][0079]
正向梯度的计算方法如下:
[0080][0081]
σ表示激活函数;
[0082]
步骤3:基于隐含层向量h,采用式(8)计算p(v
i
=1|h),记作v
i1
;
[0083][0084]
步骤4:基于v
i1
重复步骤(3.2),获得新的隐含层向量h,记作h1,然后计算反向梯度<v
i1
h1>;
[0085][0086]
步骤5:按照式(10)~式(12)更新各项参数,记作w
′
ij
,a
′
i
,b
′
j
:
[0087]
w
′
ij
=w
ij
+prob(<v
i
h>-<v
i1
h1>)
ꢀꢀꢀ
(10)
[0088]
a
′
i
=a
i
+μ|v
i-v
i1
|
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0089]
b
′
j
=b
j
+μ|h
j-h
j-1
|
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0090]
prob表示0或1的随机数;
[0091]
步骤6:重复以上步骤(3.2)到步骤(3.5),计算新的训练样本v
i2
,v
i3
,
…
,v
it
和新的隐含层向量h2,h3,
…
,h
t
,其中t为当前的训练次数,然后计算重构误差r=||v
it-v
i
||。当t达到最大训练次数t
max
或r小于重构误差阈值r时,停止训练,即可将隐含层向量h
t
作为下一层rbm的可见层v,并开展新一轮训练。
[0092]
2深度信念网络训练
[0093]
深度信念网络一般采用逐层训练方法进行学习,分为预训练和微调2个阶段。在预训练阶段,可以采用自下而上的逐层无监督学习方式,在每层都需要进行参数初始化和样本数据特征提取;在微调阶段,可以根据预训练阶段所提取的特征,采用bp神经网络算法对初始化参数进行微调。
[0094]
3变压器故障诊断模型
[0095]
基于深度信念网络的变压器故障诊断方法主要包括离线学习和在线识别2个阶段,具体步骤如下:
[0096]
步骤(1),故障样本的数据采集:采集故障样本,将故障样本划分为训练样本集合和测试样本集合;所述的故障样本包括变压器故障类型和油中溶解的h2、ch4、c2h6、c2h4、c2h2的含量;
[0097]
步骤(2),创建基于dbn的故障诊断模型:故障诊断模型中输入为油中溶解的h2、ch4、c2h6、c2h4、c2h2的含量;输出为故障类型;
[0098]
设置rbm层数和每层rbm的节点数;
[0099]
设rbm是由1个可见层v和1个隐含层h组成的双层网络,其中,v=[v1,v2,...,v
n
],为可见层单元的n个输入节点;h=[h1,h2,...,h
m
],为隐含层单元的m个输出节点;w=[w
ij
]
n
×
m
,为输入层到输出层的连接权值矩阵,其中i=1,2,...,n且j=1,2,...,m;a=[a1,a2,...,a
n
],其中a
i
为第i个可见单元v
i
的偏置;b=[b1,b2,...,b
m
],其中b
j
为第j个隐含单元h
j
的偏置;
[0100]
步骤(3),模型预训练:将训练样本集导入步骤(2)的模型中,从下而上逐层训练各层rbm,获得各层rbm的初始化参数w
ij
、a
i
、b
j
;
[0101]
步骤(4),模型微调:采用bp神经网络算法反向调整预训练参数,得到最终的dbn故障诊断模型;其中,预训练参数是指各层rbm的初始化参数w
ij
、a
i
、b
j
;
[0102]
步骤(5),测试变压器故障诊断模型的性能:将测试样本集合导入步骤(4)得到的故障诊断模型中,进行故障预测和实际工况对比,从而评估该故障诊断模型的性能。
[0103]
步骤(6),在线故障识别:将变压器实时运行数据导入最终的dbn故障诊断模型,进行故障识别。
[0104]
其中,步骤(1)中,训练样本集合和测试样本集合的样本数量比例设置为9:1。故障类型分为五种:铁芯接地、线圈故障、裸金属过热、围屏放电、匝绝缘损伤。
[0105]
步骤(2)中,设置rbm层数为5和每层rbm的节点数为10。
[0106]
步骤(4)中,反向调整预训练参数的方法为:将反向计算获得的参数与初始化参数求算数平均值。
[0107]
4变压器故障诊断算例
[0108]
本发明收集某电网110kv变电站的变压器故障案例共计3985组,其中案例主要包含的信息有:变压器油色谱数据和变压器的故障类型。随机抽取2000组案例作为故障诊断模型的训练数据,余下1985组案例作为测试数据。
[0109]
为了验证本发明所提变压器故障诊断模型有效性,利用实际变压器故障类型与诊断模型输出故障类型进行对比。为了进一步验证本发明所提故障诊断模型训练速度的优越性,本发明所提变压器故障诊断模型将与其他诊断方法进行对比,那么参与变压器故障诊断的算法有:
[0110]
·
本发明所提变压器故障诊断方法,命名为rbm-t。
[0111]
·
参考文献:赵文清,严海,周震东,邵绪强.基于残差bp神经网络的变压器故障诊断[j].电力自动化设备,2020,40(02):143-148.其中所提变压器故障诊断算法命名为bp-t。
[0112]
·
参考文选:杜名喆,王宝中.基于经验小波分解和卷积神经网络的液压泵故障诊断[j].液压与气动,2020(01):163-170.其中所提变压器故障诊断算法命名为cnn-t。
[0113]
表1变压器故障诊断模型的准确率
[0114]
故障诊断方法rbm-tbp-tcnn-t铁芯接地94.14%84.23%93.24%线圈故障94.28%86.39%94.44%裸金属过热93.61%83.88%93.13%围屏放电93.27%86.78%93.17%匝绝缘损伤95.55%82.99%95.65%
[0115]
表1给出了rbm-t、bp-t和cnn-t方法对变压器部分典型故障诊断的准确率。从表1中可以看出,bp-t方法的变压器故障诊断准确率最低,该方法对变压器铁芯接地和变压器线圈故障的诊断准确率分别为84.23%和86.39%;对于上述两种变压器故障类型,rbm-t和cnn-t的准确率分别为94.14%、94.28%和93.24%、94.44%。可以发现,本发明所提变压器故障诊断模型rbm-t平均准确率均高于94%,这也充分证明了本发明所提模型的有效性。
[0116]
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其
等效物界定。