高压变压器工况模式识别与数据分类方法及系统与流程

文档序号:14990876发布日期:2018-07-20 22:11阅读:294来源:国知局
本发明涉及高压变压器
技术领域
,尤其涉及了一种高压变压器工况模式识别与数据分类方法及系统。
背景技术
:高压变压器是电力系统的关键设备,高压变压器的可靠运行对电力系统的稳定运行至关重要,为了提高供电可靠性,除了在设备生产阶段选用技术过硬、质量过关的变压器以外,还按照国家标准、行业标准、公司标准制定了一系列的阈值,在变压器上安装传感器并且进行实时的在线监测,当变压器的某一项指标超出标准规定的阈值时,判断变压器发生了相应的故障,目前市场上的变压器在线诊断系统多采用这种方式,经过实际观察,发现这种方式误报率非常高,常常会带来不必要的麻烦。此外,当前针对运用机器学习算法的变压器状态评估和故障诊断方法多直接针对变压器的数据进行算法模型的设计、训练和预测,模型的准确率和鲁棒性都较低。以上两种方法均未考虑变压器的工况对监测数据造成的影响。例如当变压器运行环境温度升高时,变压器绝缘油油温会相应的升高,此时无法区分油温温度升高是否为变压器故障造成。当变压器负载增加时,变压器绕组温度升高,此时绕组温度将可能超出阈值,在线监测系统发出警报,但是变压器本身并无故障。高压变压器专门用于输配电行业,工作环境常常因气候等原因发生变化,夏季由于温度较高会造成变压器整体温度升高,冬季由于温度较低会造成变压器整体温度的降低,昼夜间电量需求的巨大变化会造成变压器负载的巨大变化,季节性的用电需求变化会导致变压器负载的节律性的变化。这些变化都会导致变压器油温、绕组温度升高、油中溶解气体发生变化等影响。因此,针对变压器工况对变压器的监测数据进行分类需求强烈。在当前的国家标准及行业标准《电力设备预防性试验规程》、《变压器油中溶解气体分析和判断导则》中并无针对变压器工况不同的情况下对变压器监测数据进行分割或分情况处理的说明,而是针对变压器所有工况设定同一或有限阈值,无论变压器处在何种工况下,当变压器在线监测数据变化超出阈值时即判断变压器发生异常,无法得知变压器在线监测数据超出阈值是否为变压器异常或变压器工况发生变化。此外,变压器的工况如温度、负载等往往是连续变化的,也会对工况的定义造成很大的困难,针对变压器在线监测数据需进行工况分割的需求,本专利提出一种工况模式识别的方法,针对变压器工况进行模式识别,为数据分割、分工况进行故障诊断、状态评价、故障预测等工作提供数据基础。技术实现要素:本发明针对现有技术中的缺点,提供了一种高压变压器工况模式识别与数据分类方法及系统。为了解决上述技术问题,本发明通过下述技术方案得以解决:本发明披露了:一种高压变压器工况模式识别与数据分类方法,包括以下步骤:采集高压变压器的工况数据,将所述工况数据定义为数值型工况数据和字符型工况数据;分别构建数值型工况数据和字符型工况数据的工况模式识别分类器,记作第一工况模式识别分类器和第二工况模式识别分类器,其中,构建所述第一工况模式识别分类器时,首先,对数值型工况数据进行预处理,得到数组序列;其次,对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集;再次,通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器;根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果。作为一种可实施方式,所述对数值型工况数据进行预处理,得到数组序列的具体步骤为:根据采集到的工况数据,从工况数据中提取数值型工况数据;采用箱形法对选取的数值型工况数据进行处理,得到数组序列。作为一种可实施方式,所述采用箱形法对数据进行处理,得到数组序列的具体步骤为:从数值型工况数据中选取l个点作为时间窗口,将在时间窗口范围内的数值型工况数据从小到大进行排序,形成排序后的序列;从序列中选取第大的数字作为下四分位数,其中,l为时间窗口的点数,即序列的长度,从序列中选取第大的数字作为上四分位数;将序列中大于上四分位数或者小于下四分位数的点作为异常点从序列中剔除,并填入空值;采用插值法将序列中的空值补全,组成新的序列,记作第一序列,此第一序列即为所述数组序列。作为一种可实施方式,所述对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集的具体步骤为:对第一序列中所有元素采用ap算法进行聚类,具体步骤为:计算第一序列中各点两两之间的欧式距离,取欧氏距离的负值称为相似度,进而组成相似度矩阵;选取相似度矩阵中除0以外最小值,将相似度矩阵中主对角线上的所有零点替换为所述最小值,组成新的相似度矩阵,记作第一相似度矩阵;计算第一相似度矩阵的吸引度矩阵和归属度矩阵,对样本点的吸引度和归属度求和,得到两者之和,将两者之和作为聚类中心;重复计算及求和步骤,直到聚类中心不变或者达到指定迭代次数时结束迭代,取吸引度和归属度和为正值的节点作为聚类中心,按照归属度区分各节点所属的类别,形成若干类数组;将已经聚类为若干类的数组按照数组所属的类别进行标注,组成样本集;将样本集中每个类别的数组分成两份,一份为训练集,另一份为测试集。作为一种可实施方式,所述通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器的具体步骤为:运用softmax算法构建第一工况模式识别分类器,采用训练集数据对分类器进行训练,采用测试集数据对分类器进行测试,其中,softmax算法的具体以过程为:构建softmax回归模型:其中,p(y(i)=j|x(i);θ)表示输入x(i)属于第j类的概率,j表示所属类别,x(i)表示需要进行分类的输入矩阵,θ表示模型参数;定义softmax回归模型的代价函数:其中,1{y(i)=j}表示当{y(i)=j}时1{y(i)=j}=1,当y(i)≠j时1{y(i)=j}=0,为衰减项,λ>0为衰减因子,m表示训练集中样本的数量;基于训练集数据采用梯度下降法求最小值,即可得到softmax模型参数;采用测试集对训练好的softmax模型进行测试,当测试结果准确率达到预期要求时,则训练好的softmax模型即为第一工况模式识别分类器,若不满足要求,则返回聚类步骤进行重新聚类,直至softmax模型达到要求。作为一种可实施方式,构建第二工况模式识别分类器的步骤为:根据采集到的工况数据,从工况数据中提取字符型工况数据;对字符型数据中的文本进行统计,将相同的文本归为一类,不同的文本归为不同的类别,当遇到字符型数据时,将字符型数据与统计结果进行匹配,将字符型数据归类到文本相同的类别,最终构建出第二工况模式识别分类器。本发明还披露了:一种高压变压器工况模式识别与数据分类系统,包括数据采集定义模块、分类器构建模块和识别执行模块;所述数据采集定义模块,用于采集高压变压器的工况数据,将所述工况数据定义为数值型工况数据和字符型工况数据;所述分类器构建模块,用于分别构建数值型工况数据和字符型工况数据的工况模式识别分类器,记作第一工况模式识别分类器和第二工况模式识别分类器;所述识别执行模块,用于根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果;其中,所述分类器构建模块包括第一工况模式识别分类器构建模块和第二工况模式识别分类器构建模块,其中,所述第一工况模式识别分类器构建模块,用于构建所述第一工况模式识别分类器;所述第一工况模式识别分类器构建模块包括预处理单元、生成样本单元和训练测试单元;所述预处理单元,用于对数值型工况数据进行预处理,得到数组序列;所述生成样本单元,用于对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集;所述训练测试单元,用于通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器。作为一种可实施方式,所述预处理单元包括数据提取单元和数组获取单元;所述数据提取单元,用于根据采集到的工况数据,从工况数据中提取数值型工况数据;所述数组获取单元,用于采用箱形法对选取的数值型工况数据进行处理,得到数组序列。作为一种可实施方式,所述第二工况模式识别分类器构建模块包括字符型数据提取单元和构建单元;所述字符型数据提取单元,用于根据采集到的工况数据,从工况数据中提取字符型工况数据;所述构建单元,用于对字符型数据中的文本进行统计,将相同的文本归为一类,不同的文本归为不同的类别,当遇到字符型数据时,将字符型数据与统计结果进行匹配,将字符型数据归类到文本相同的类别,最终构建出第二工况模式识别分类器。本发明还披露了:一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现高压变压器工况模式识别与数据分类方法的步骤。本发明由于采用了以上技术方案,具有显著的技术效果:采用本发明的方法针对变压器的在线监测数据进行自动工况模式识别,为后续的数据分割提供了基础;本发明的方法应用了大数据技术,将采集到的变压器进行在线监测,并且将数据建立成第一工况模式识别分类器和第二工况模式识别分类器,通过第一工况模式识别分类器和第二工况模式识别分类器对工况模式数据进行识别分类,并且,随着数据量的增加和积累,第一工况模式识别分类器和第二工况模式识别分类器会不断被细化和精确化。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本发明的整体流程示意图;图2是本发明的分类识别过程示意图;图3是本发明采用箱形法对数据进行处理的流程示意图;图4是本发明具体完整流程示意图;图5是本发明的系统示意图;图6是本发明的分类器构建模块的整体结构示意图。标号说明:100、数据采集定义模块;200、分类器构建模块;300、识别执行模块;210、第一工况模式识别分类器构建模块;220、第二工况模式识别分类器构建模块;211、预处理单元;212、生成样本单元;213、训练测试单元;2111、数据提取单元;2112、数组获取单元;221、字符型数据提取单元;222、构建单元。具体实施方式下面结合实施例对本发明做进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。实施例1:一种高压变压器工况模式识别与数据分类方法,如图1所示,包括以下步骤:s100、采集高压变压器的工况数据,将所述工况数据定义为数值型工况数据和字符型工况数据;s200、分别构建数值型工况数据和字符型工况数据的工况模式识别分类器,记作第一工况模式识别分类器和第二工况模式识别分类器,其中,构建所述第一工况模式识别分类器时,首先,对数值型工况数据进行预处理,得到数组序列;其次,对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集;再次,通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器;s300、根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果。在步骤s100中,所述的工况是指设备在和其动作有直接关系的条件下的工作状态,更具体地,在本发明中,工况指变压器在不同的运行环境下的工作状态。当前能被监测到的变压器的运行工况数据有海拔、天气状况、相对湿度、环境温度、各相电流、各相电压等,将这些数据进行采集,并且整理成以下两个表格,数据如表1表2所示:表1环境信息表序号开关量名称数据格式数据来源1天气状况字符气象局2环境温度数值传感器3相对湿度数值传感器4海拔数值人工填写表2scada数据表按照表1和表2来选取数值型工况数据和字符型工况数据。在步骤s200中,所述对数值型工况数据进行预处理,得到数组序列的具体步骤为:s210、根据采集到的工况数据,从工况数据中提取数值型工况数据;s220、采用箱形法对选取的数值型工况数据进行处理,得到数组序列。在步骤s220中,如图3所示,所述采用箱形法对数据进行处理,得到数组序列的具体步骤为:从数值型工况数据中选取l个点作为时间窗口,将在时间窗口范围内的数值型工况数据从小到大进行排序,形成排序后的序列a1;从序列a1中选取第大的数字作为下四分位数q1,其中,l为时间窗口的点数,即序列的长度,从序列中选取第大的数字作为上四分位数q3;将序列a1中大于上四分位数q3或者小于下四分位数q1的点作为异常点从序列a1中剔除,并填入空值;采用插值法将序列a1中的空值补全,组成新的序列,记作第一序列,此第一序列即为所述数组序列a={a1,a2...,an}。在步骤s200中,所述对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集的具体步骤为:对第一序列a={a1,a2...,an}中所有元素采用ap算法进行聚类,具体步骤为:计算第一序列a={a1,a2...,an}中各点两两之间的欧式距离,取欧氏距离的负值称为相似度si,j,进而组成相似度矩阵s;选取相似度矩阵s中除0以外最小值a,将相似度矩阵s中主对角线上的所有零点替换为所述最小值a,组成新的相似度矩阵s,记作第一相似度矩阵;计算第一相似度矩阵的吸引度矩阵和归属度矩阵,对样本点的吸引度和归属度求和,得到两者之和,将两者之和作为聚类中心,在此,吸引度矩阵的计算公式为:r(i,k)=s(i,k)-maxk'≠k{a(i,k')+s(i,k')}其中,s(i,k)表示点i对点k的相似程度,在第一次迭代中使用相似度矩阵s代替,a(i,k')表示除k以外其他点对i点的归属度值,初始值为0,s(i,k')表示除k以外其他点对i的吸引度;归属度的计算公式为:和公式a(k,k)=∑i'≠kmax{0,r(i',k)}其中,表示k作为除i以外其他点的聚类中心的相似度值,取所有大于等于0的吸引度值,r(k,k)表示k做为聚类中心的可能性;重复计算及求和步骤,直到聚类中心不变或者达到指定迭代次数时结束迭代,取吸引度和归属度和为正值的节点作为聚类中心,按照归属度区分各节点所属的类别,形成若干类数组;将已经聚类为k类的数组按照数组所属的类别进行标注,由1至k打上标签,组成样本集,在此,为了防止训练分类算法时产生的不平衡现象,取所有聚类类别中数组数目最少的一类的数组数目为基准,运用随机抽样的方法对其余类别进行抽样,使得每个类别中的数组个数相同,将所有经过处理的类别组成样本集;将样本集中每个类别的数组分成两份,一份为训练集train_b,另一份为测试集test_b,进行训练模型。更具体地,在步骤s200中,所述通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器的具体步骤为:运用softmax算法构建第一工况模式识别分类器,采用训练集数据对分类器进行训练,采用测试集数据对分类器进行测试,其中,softmax算法的具体以过程为:构建softmax回归模型:其中,p(y(i)=j|x(i);θ)表示输入x(i)属于第j类的概率,j表示所属类别,x(i)表示需要进行分类的输入矩阵,θ表示模型参数;定义softmax回归模型的代价函数:其中,1{y(i)=j}表示当{y(i)=j}时1{y(i)=j}=1,当y(i)≠j时1{y(i)=j}=0,为衰减项,λ>0为衰减因子,m表示训练集中样本的数量;基于训练集数据采用梯度下降法求最小值,即可得到softmax模型参数;采用测试集对训练好的softmax模型进行测试,当测试结果准确率达到预期要求时,则训练好的softmax模型即为第一工况模式识别分类器,若不满足要求,则返回聚类步骤进行重新聚类,直至softmax模型达到要求。根据步骤s100和s200,制作出完成的流程图,参加附图4。更具体地,在步骤s200中,构建第二工况模式识别分类器的步骤为:根据采集到的工况数据,从工况数据中提取字符型工况数据;对字符型数据中的文本进行统计,将相同的文本归为一类,不同的文本归为不同的类别,当遇到字符型数据时,将字符型数据与统计结果进行匹配,将字符型数据归类到文本相同的类别,最终构建出第二工况模式识别分类器。最后,如图2所示,步骤s300中根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果的具体过程为:当有新的工况数据需要进行工况分类时,首先在每一个工况维度对工况数据进行预处理,将预处理过后的工况数据传入其相对应数据类型的工况模式识别分类器中,工况模式识别分类器会自动的给出每一个维度的数据在其维度中所属的类别;将工况数据每一个维度的分类结果组合成一个数组,数组内所有分类结果都相同的数据为相同工况,否则为不同工况。本发明还公开了:一种高压变压器工况模式识别与数据分类系统,如图5所示,包括数据采集定义模块100、分类器构建模块200和识别执行模块300;所述数据采集定义模块100,用于采集高压变压器的工况数据,将所述工况数据定义为数值型工况数据和字符型工况数据;所述分类器构建模块200,用于分别构建数值型工况数据和字符型工况数据的工况模式识别分类器,记作第一工况模式识别分类器和第二工况模式识别分类器;所述识别执行模块300,用于根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果;其中,所述分类器构建模块200包括第一工况模式识别分类器构建模块210和第二工况模式识别分类器构建模块220,如图6所示,其中,所述第一工况模式识别分类器构建模块210,用于构建所述第一工况模式识别分类器;所述第一工况模式识别分类器构建模块210包括预处理单元211、生成样本单元212和训练测试单元213;所述预处理单元211,用于对数值型工况数据进行预处理,得到数组序列;所述生成样本单元212,用于对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集;所述训练测试单元213,用于通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器。更具体地,所述预处理单元211包括数据提取单元2111和数组获取单元2112;所述数据提取单元2111,用于根据采集到的工况数据,从工况数据中提取数值型工况数据;所述数组获取单元2112,用于采用箱形法对选取的数值型工况数据进行处理,得到数组序列。更具体地,所述第二工况模式识别分类器构建模块220包括字符型数据提取单元221和构建单元222;所述字符型数据提取单元221,用于根据采集到的工况数据,从工况数据中提取字符型工况数据;所述构建单元222,用于对字符型数据中的文本进行统计,将相同的文本归为一类,不同的文本归为不同的类别,当遇到字符型数据时,将字符型数据与统计结果进行匹配,将字符型数据归类到文本相同的类别,最终构建出第二工况模式识别分类器。本发明还披露了:一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现高压变压器工况模式识别与数据分类方法的步骤。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本发明是参照根据本发明的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。此外,需要说明的是,本说明书中所描述的具体实施例,其零、部件的形状、所取名称等可以不同。凡依本发明专利构思所述的构造、特征及原理所做的等效或简单变化,均包括于本发明专利的保护范围内。本发明所属
技术领域
的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1