本发明涉及变压器故障诊断领域,具体涉及一种基于聚类算法的变压器故障诊断系统。
背景技术:
电力变压器作为电力系统中最重要的设备之一,其运行状态直接影响到整个电力系统的安全性和稳定性。由于电力变压器内部结构的复杂性,运行环境的特殊性,在变压器的长期运行当中,发生故障是不可避免的。一旦发生故障,将会严重影响社会的生产和人们的生活,造成严重的经济损失。
技术实现要素:
针对上述问题,本发明提供一种容易实施、能够提高故障诊断正确率及工作效率的基于聚类算法的变压器故障诊断系统。
本发明的目的采用以下技术方案来实现:
一种基于聚类算法的变压器故障诊断系统,包括样本采集模块、数据预处理模块、样本分析聚类模块、神经网络训练模块和故障类别判断模块;
所述样本采集模块用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
其中,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
优选地,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
其中,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.4,1.8]。
本发明的有益效果为:
1、容易实施、工作效率高;
2、设置样本分析聚类模块、神经网络训练模块,通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本,就完全可以避免以往由于随机挑选训练样本和测试样本所带来的问题,而良好的测试样本能够对神经网络进行更为完整的测试,从而确保神经网络得到正确合理的评价;
3、通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了提高变压器故障诊断系统的诊断正确率。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明各模块的连接示意图;
图2是本发明系统运作流程示意图。
附图标记:
样本采集模块1、数据预处理模块2、样本分析聚类模块3、神经网络训练模块4、故障类别判断模块5。
具体实施方式
结合以下实施例对本发明作进一步描述。
实施例1
参见图1、图2,本实施例的基于聚类算法的变压器故障诊断系统,包括样本采集模块1、数据预处理模块2、样本分析聚类模块3、神经网络训练模块4、故障类别判断模块5;
所述样本采集模块1用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块2,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块3,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块4,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块5,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
其中,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
其中,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
本实施例容易实施、工作效率高;设置样本分析聚类模块3、神经网络训练模块4,通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本,就完全可以避免以往由于随机挑选训练样本和测试样本所带来的问题,而良好的测试样本能够对神经网络进行更为完整的测试,从而确保神经网络得到正确合理的评价;通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了提高变压器故障诊断系统的诊断正确率,其中设定比例值T=1.4,诊断正确率相对提高了3.5%。
实施例2
参见图1、图2,本实施例的基于聚类算法的变压器故障诊断系统,包括样本采集模块1、数据预处理模块2、样本分析聚类模块3、神经网络训练模块4、故障类别判断模块5;
所述样本采集模块1用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块2,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块3,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块4,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块5,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
其中,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
其中,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[aim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
本实施例容易实施、工作效率高;设置样本分析聚类模块3、神经网络训练模块4,通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本,就完全可以避免以往由于随机挑选训练样本和测试样本所带来的问题,而良好的测试样本能够对神经网络进行更为完整的测试,从而确保神经网络得到正确合理的评价;通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了提高变压器故障诊断系统的诊断正确率,其中设定比例值T=1.5,诊断正确率相对提高了4%。
实施例3
参见图1、图2,本实施例的基于聚类算法的变压器故障诊断系统,包括样本采集模块1、数据预处理模块2、样本分析聚类模块3、神经网络训练模块4、故障类别判断模块5;
所述样本采集模块1用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块2,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块3,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块4,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块5,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
其中,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
其中,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
本实施例容易实施、工作效率高;设置样本分析聚类模块3、神经网络训练模块4,通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本,就完全可以避免以往由于随机挑选训练样本和测试样本所带来的问题,而良好的测试样本能够对神经网络进行更为完整的测试,从而确保神经网络得到正确合理的评价;通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了提高变压器故障诊断系统的诊断正确率,其中设定比例值T=1.6,诊断正确率相对提高了3%。
实施例4
参见图1、图2,本实施例的基于聚类算法的变压器故障诊断系统,包括样本采集模块1、数据预处理模块2、样本分析聚类模块3、神经网络训练模块4、故障类别判断模块5;
所述样本采集模块1用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块2,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块3,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块4,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块5,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
其中,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
其中,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,=l表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
本实施例容易实施、工作效率高;设置样本分析聚类模块3、神经网络训练模块4,通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本,就完全可以避免以往由于随机挑选训练样本和测试样本所带来的问题,而良好的测试样本能够对神经网络进行更为完整的测试,从而确保神经网络得到正确合理的评价;通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了提高变压器故障诊断系统的诊断正确率,其中设定比例值T=1.7,诊断正确率相对提高了2.1%。
实施例5
参见图1、图2,本实施例的基于聚类算法的变压器故障诊断系统,包括样本采集模块1、数据预处理模块2、样本分析聚类模块3、神经网络训练模块4、故障类别判断模块5;
所述样本采集模块1用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块2,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块3,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块4,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块5,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
其中,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
其中,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
本实施例容易实施、工作效率高;设置样本分析聚类模块3、神经网络训练模块4,通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本,就完全可以避免以往由于随机挑选训练样本和测试样本所带来的问题,而良好的测试样本能够对神经网络进行更为完整的测试,从而确保神经网络得到正确合理的评价;通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了提高变压器故障诊断系统的诊断正确率,其中设定比例值T=1.8,诊断正确率相对提高了1.5%。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。