电气负载启动运行识别装置的制作方法

文档序号:18467057发布日期:2019-08-17 02:35阅读:135来源:国知局
电气负载启动运行识别装置的制作方法

本发明涉及一种设备识别及分类装置与方法,尤其是涉及一种电气负载启动运行识别装置。



背景技术:

目前,主流的,包括电气负载性质识别在内的电气负载类型或者启动运行识别方法有基于负载功率综合系数算法的电气负载识别方法、基于电磁感应的电气负载识别方法、基于神经网络算法的电气负载识别方法、基于周期性离散变换算法的电气负载识别方法等。各种方法均能够在一定程度是实现电气负载性质的识别,但由于特征性质单一,识别手段单一,普遍存在泛化能力不够及不能完全准确识别的问题,特别是在多个负载同时运行的情况下,不能准确识别电气负载的启动运行。



技术实现要素:

本发明的目的在于,针对现在已有技术的缺陷,提供一种在复合运行的负载中,能够识别启动运行的电气负载的装置,包括信息采集模块、信息处理模块、通信模块;所述信息采集模块用于采集电气负载的负载电流并转换成电流数字信号,电流数字信号被送至信息处理模块,通信模块用于发送信息处理模块的电气负载类型识别结果至上位机,信息处理模块依据输入的电流数字信号,采用分类器进行电气负载启动运行识别。所述分类器的输入特征包括电气负载的启动电流特征和电气负载的稳态电流频谱特征;所述启动电流特征包括启动过程时间、启动电流最大值、启动电流最大值时间;所述分类器为基于隶属偏离平方和的改进决策树分类器,构建流程如下:

步骤⑴、获取多组电气负载的输入特征样本,随机选择其中部分输入特征样本作为训练数据样本,其他输入特征样本作为测试数据样本;对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征;

步骤⑵、根据电气负载区间化输入特征的重叠状态,找到当前节点待选择输入特征的中间分裂点,将区间化输入特征的区间分段化;

步骤⑶、计算当前节点待选择输入特征的信息量;所述待选择输入特征是指每一个待选择作为当前节点判别属性(分类属性)的输入特征;

步骤⑷、计算当前节点待判别电气负载的每个待选择输入特征的信息熵;

步骤⑸、计算当前节点的每个待选择输入特征的总信息熵;

步骤⑹、计算当前节点的每个待选择输入特征的信息增益;

步骤⑺、选择当前节点待选择输入特征中信息增益最大的输入特征作为当前节点的判别属性,形成分支完成当前节点的建立;递归调用步骤⑵到步骤⑺,完成所有判别分支的建立;

步骤⑻、对不是纯净集的输出节点,分别计算所有输入特征针对该节点所有待识别电气负载类型的隶属偏离平方和,采用隶属偏离平方和作为该节点的判别属性,选择其中隶属偏离平方和最小的电气负载类型输出。

所述分类器或者为在基于隶属偏离平方和的改进决策树分类器的步骤⑴至步骤⑻基础上,增加下述步骤所构建的基于隶属偏离平方和和贝叶斯的复合优化决策树分类器,增加的步骤如下:

步骤⑼、采用步骤⑴获取的电气负载样本输入特征中的训练数据样本,训练并建立贝叶斯分类器;

步骤⑽、记录步骤⑻中所有采用隶属偏离平方和作为节点判别属性的节点,准备进行分类优化;

步骤⑾、选择一个采用隶属偏离平方和作为节点判别属性,未进行分类优化的节点进行分类优化,方法是,将步骤⑴获取的电气负载样本输入特征中的测试数据样本依次输入至复合优化决策树分类器,统计该节点采用隶属偏离平方和作为节点判别属性时的总电气负载识别准确率;该节点使用贝叶斯分类器分类,替代该节点采用隶属偏离平方和作为节点判别属性的方法,将步骤⑴获取的电气负载样本输入特征的测试数据样本依次输入至复合优化决策树分类器,统计该节点采用贝叶斯分类器分类时的总电气负载识别准确率;选择总电气负载识别准确率高的方法作为该节点进行电气负载启动运行识别的方法;

步骤⑿、若步骤⑻中所有采用隶属偏离平方和作为节点判别属性的节点未全部完成分类优化,返回步骤⑾;若步骤⑻中所有采用隶属偏离平方和作为节点判别属性的节点全部完成分类优化,完成复合优化决策树分类器的构造。

步骤⑶中,计算当前节点每个输入特征的信息量的方法是:

式中,x代表该信息量所针对的输入特征,x包括且只包括属于当前节点待选择作为判别属性的输入特征;p为在当前节点待判别电气负载类型中能准确地区分出电气负载类型的该负载特征参数区间范围的总和;n为在当前节点待判别电气负载类型中不能准确地区分出电气负载类型的该负载特征参数区间范围的总和。

步骤⑷中,计算当前节点待判别电气负载的每个输入特征的信息熵的方法是:

式中,x代表该信息熵所针对的输入特征,x包括且只包括属于当前节点待选择的输入特征;i代表该信息熵所针对的电气负载类型,i包括且只包括属于当前节点待判别的电气负载类型;pi为该电气负载类型输入特征x的区间范围中与该节点待选择的其他输入特征均不重叠的区间范围;ni为该电气负载类型输入特征x的区间范围中与当前节点待选择的其他输入特征相重叠的区间范围。

步骤⑸中,计算当前节点的每个待选择输入特征的总信息熵的方法是:

式中,x代表该信息熵或者总信息熵所针对的输入特征,x包括且只包括属于当前节点待选择作为判别属性的输入特征;i代表待识别的某种电气负载类型,k代表需分类的电气负载类型的种类总数;pi为与i所代表电气负载类型输入特征x的区间范围中与该节点待选择的其他输入特征均不重叠的区间范围;ni为与i所代表电气负载类型输入特征x的区间范围中与当前节点待选择的其他输入特征相重叠的区间范围;p为在该节点待判别电气负载类型中能准确地区分出电气负载类型的该负载特征参数区间范围的总和;n为在该节点待判别电气负载类型中不能准确地区分出电气负载类型的该负载特征参数区间范围的总和。

步骤⑹中,计算当前节点的每个待选择输入特征的信息增益的方法是:

gain(x)=ix(p,n)-e(x)

式中,x代表该信息熵或者总信息熵所针对的输入特征,x包括且只包括属于当前节点待选择作为判别属性的输入特征。

步骤⑻中,分别计算所有输入特征针对该节点所有待识别电气负载类型的隶属偏离平方和,计算所有输入特征针对其中一种电气负载类型的隶属偏离平方和的方法是,分别计算所有输入特征在该种电气负载类型中的隶属偏离度,隶属偏离平方和为所有输入特征在该种电气负载类型中的隶属偏离度的平方和。

计算输入特征在电气负载类型中的隶属偏离度的方法是:

式中,x代表该隶属偏离度所针对的输入特征,i代表所针对的电气负载类型,ri(x)代表输入特征x在i所代表电气负载类型中的隶属偏离度;d0为输入特征x在i所代表电气负载类型区间化输入特征的区间中心值,d1为输入特征x在i所代表电气负载类型区间化输入特征的区间下限值,d为输入特征x的实际输入值。

步骤⑼中,训练并建立贝叶斯分类器的方法是:

步骤①、对某个输入特征属性进行分段划分,即进行离散化处理;

步骤②、将步骤⑴中的训练数据样本作为贝叶斯分类器的训练数据样本;计算每类电气负载类型训练数据样本在所有电气负载类型训练数据样本中所占有的比例;

步骤③、计算训练样本每个类型(类别)条件下各个输入特征属性分段的比例(频率),统计得到各类型(类别)下各个输入特征属性的条件概率估计。

步骤⑾中,节点使用贝叶斯分类器分类的方法是:

步骤㈠、将复合优化决策树分类器的输入特征作为贝叶斯分类器的输入特征;

步骤㈡、按照式

计算每种电气负载类别的后验概率,其中

步骤㈢、针对该节点所有待识别电气负载类型,选择其中后验概率最大的电气负载类型输出。

所述电气负载的启动电流特征和电气负载的稳态电流频谱特征通过以下方法获得:

步骤1、获取复合负载的负载电流有效值作为第一负载电流有效值;复合负载的负载电流有效值为最近n个工频周期的复合负载电流有效值的平均值。

步骤2、当第一负载电流有效值小于等于ε1时,对复合负载的负载电流进行连续采样,并对负载电流有效值的大小进行判别,直到当负载电流有效值大于ε1时,判定当前有电气负载开始启动运行并转向步骤4;在此之前没有电气负载运行,复合负载平均电流有效值设定为0,复合负载基波平均幅值设定为0,谐波次数为m次的复合负载奇次谐波平均幅值设定为0;

当第一负载电流有效值大于ε1时,对复合负载的负载电流进行连续采样,连续获取复合负载的稳态电流频谱特征和第一负载电流有效值,对复合负载的稳态电流频谱特征和第一负载电流有效值进行加权融合得到复合负载的电流特征融合值并作为第一电流特征融合值,对第一电流特征融合值与平均电流特征融合值的差值进行判别,直到当第一电流特征融合值与平均电流特征融合值的差值大于ε2时,判定当前有电气负载启动运行或者停止运行,转向步骤3。

步骤3、当第一负载电流有效值大于复合负载平均电流有效值时,判定当前有电气负载启动运行并转向步骤4;当第一负载电流有效值小于等于复合负载平均电流有效值时,判定当前有电气负载停止运行;对复合负载的负载电流进行连续采样,以工频周期为单位计算复合负载电流有效值并保存;计算最近n个工频周期的复合负载电流有效值的平均值并作为新的复合负载平均电流有效值;获取负载电流频谱特性,将负载电流频谱特性中谐波次数为m次的奇次谐波幅值作为新的谐波次数为m次的复合负载奇次谐波平均幅值;将负载电流频谱特性中的基波幅值作为新的复合负载基波平均幅值;转向步骤1;所述m=3,…,m;所述m为谐波次数为m次的奇次谐波中的最高次数值,且m大于等于3。

步骤4、对复合负载的负载电流进行连续采样,以工频周期为单位计算复合负载电流有效值并保存,计算最近n个工频周期的复合负载电流有效值的平均值,将最近n个工频周期之内每个工频周期的复合负载电流有效值与复合负载平均电流有效值之间的差值作为最近n个工频周期之内每个工频周期的电气负载电流有效值,将该n个工频周期的复合负载电流有效值的平均值与复合负载平均电流有效值之间的差值作为该n个工频周期的电气负载电流有效值的平均值,直到当最近n个工频周期之内的每个工频周期的电气负载电流有效值与该n个工频周期的电气负载电流有效值的平均值相比较,波动幅度均小于设定的相对误差范围e时,判定当前启动的电气负载进入稳定状态,转向步骤5。

步骤5、获取电气负载的稳态电流频谱特征;获取复合负载的稳态电流频谱特征;将最近n个工频周期的复合负载电流有效值的平均值作为新的复合负载平均电流有效值;对复合负载的稳态电流频谱特征和复合负载电流有效值进行加权融合得到电流特征融合值并作为平均电流特征融合值;将最近n个工频周期的电气负载电流有效值的平均值作为电气负载的稳态电流有效值;将判定有电气负载开始启动运行时刻至最近n个工频周期起始时刻之间的时间作为启动过程时间;将判定有电气负载开始启动运行时刻至启动过程时间之内负载电流有效值最大的工频周期之间的时间作为启动电流最大值时间;将启动电流最大值时间所在工频周期的电气负载电流有效值与电气负载的稳态电流有效值之间的比值作为启动电流最大值。

所述ε1为大于0的数值;所述ε2为大于0的数值;所述n的取值范围为50-500;所述e的取值范围为2%-20%。

所述获取电气负载的稳态电流频谱特征和复合负载的稳态电流频谱特征的方法是:

步骤i、获取复合负载的稳态电流信号,并将其转换为对应的稳态电流数字信号;

步骤ii、对稳态电流数字信号进行傅立叶变换,得到负载电流频谱特性;

步骤iii、将负载电流频谱特性中谐波次数为m次的奇次谐波幅值与基波幅值之间的相对比值作为复合负载的稳态电流频谱特征;将负载电流频谱特性中谐波次数为m次的奇次谐波幅值依次减去谐波次数为m次的复合负载奇次谐波平均幅值作为电气负载的m次的奇次谐波幅值;将负载电流频谱特性中的基波幅值减去复合负载基波平均幅值作为电气负载的基波幅值;将电气负载的m次的奇次谐波幅值与电气负载的基波幅值之间的相对比值作为电气负载的稳态电流频谱特征;将负载电流频谱特性中谐波次数为m次的奇次谐波幅值作为新的谐波次数为m次的复合负载奇次谐波平均幅值;将负载电流频谱特性中的基波幅值作为新的复合负载基波平均幅值。

对复合负载的稳态电流频谱特征和负载电流有效值进行加权融合得到电流特征融合值的方法是,将负载电流频谱特性中谐波次数为m次的奇次谐波信号与基波之间的各个相对幅值,以及负载电流有效值进行加权求和,加权求和值为电流特征融合值。加权求和值的求取方法是:

q=α1·i+α3·a3+…+αm·am

式中,i为第一负载电流有效值时,q为第一电流特征融合值;i为复合负载平均电流有效值时,q为平均电流特征融合值;a3、…、am依次为负载电流频谱特性中谐波次数为3次至m次奇次谐波信号与基波之间的相对幅值;α1、α3、…、αm为加权系数。

所述信息采集模块包括电流传感器、前置放大器、滤波器、a/d转换器;所述信息处理模块的核心为dsp,或者为arm,或者为单片机,或者为fpga。

所述a/d转换器可以采用信息处理模块的核心中包括的a/d转换器。

所述信息采集模块、信息处理模块、通信模块的全部或者部分功能集成在一片soc上。

所述通信模块还接收上位机的相关工作指令;所述通信模块与上位机之间的通信方式包括无线通信方式与有线通信方式;所述无线通信方式包括zigbee、蓝牙、wifi、433mhz数传方式;所述有线通信方式包括485总线、can总线、互联网、电力载波方式。

本发明的有益效果是:提供了一种在复合运行的负载中,能够识别启动运行的电气负载的方法与装置,同时采用电气负载的启动电流特征、电气负载的稳态电流频谱特征作为识别特征,并同时提供了在复合运行的负载中如何提取电气负载的启动电流特征、电气负载的稳态电流频谱特征的方法;对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征,区间化之后的输入特征减小了训练数据样本大小对决策树分类的影响,能够很大程度上弥补样本问题造成的训练数据缺失;采用基于隶属偏离平方和的改进决策树分类器或者是基于隶属偏离平方和和贝叶斯的复合优化决策树分类器进行识别分类,避免当不同电气负载类型的所有输入特征均落入相应的区间化输入特征重叠区域,仅靠将区间化输入特征的区间分段化无法完全实现决策分类识别的情况;以及避免当因为训练数据样本覆盖不全,或者是因为测量干扰误差,造成部分输入特征均落入相应的区间化输入特征的有效区间之外,而另外的输入特征均落入相应的区间化输入特征重叠区域,仅靠将区间化输入特征的区间分段化无法完全实现决策分类识别的情况;所述方法的泛化能力与识别准确率高。

附图说明

图1为本发明电气负载启动运行识别装置实施例的结构示意图;

图2为启动冲击性电阻类负载单独启动的启动过程电流波形;

图3为无启动冲击电阻类负载单独启动的启动过程电流波形;

图4为异步电机类负载单独启动的启动过程电流波形;

图5为整流滤波类负载单独启动的启动过程电流波形;

图6为复合负载中无启动冲击电阻类负载的启动过程电流波形;

图7为复合负载中整流滤波类负载的启动过程电流波形;

图8为识别装置进行电气负载启动运行识别的流程图;

图9为根节点区间化输入特征δi*的区间分段化的示意图;

图10为根节点区间化输入特征δts的区间分段化的示意图;

图11为排除异步电机类负载后区间化输入特征δts的区间分段化的示意图;

图12为排除异步电机类负载后区间化输入特征δa7的区间分段化的示意图。

具体实施方式

以下结合附图对本发明作进一步说明。

图1为本发明电气负载启动运行识别装置实施例的结构示意图,包括信息采集模块101、信息处理模块102、通信模块103。

信息采集模块102用于采集电气负载的负载电流并将负载电流转换成电流数字信号,电流数字信号被送至信息处理模块102。信息采集模块中包括电流传感器、前置放大器、滤波器、a/d转换器等组成部分,分别完成负载电流信号的传感、放大、滤波与模数转换功能。当负载电流范围较大时,可以选择具有程控功能的前置放大器,或者是在a/d转换器前再增加一个独立的程控放大器,对范围较大的负载电流实行分段控制放大,使输入至a/d转换器的电压信号范围保持在合理的区间,保证转换精度。滤波器用于滤除高频分量,避免频谱混叠。

信息处理模块102依据输入的电流数字信号,采用分类器实现电气负载启动运行识别。分类器的输入特征包括电气负载的启动电流特征和电气负载的稳态电流频谱特征。信息处理模块102的核心为dsp、arm、单片机,或者为fpga。当信息处理模块的核心中包括有a/d转换器且该a/d转换器满足要求时,信息采集模块101中的a/d转换器可以采用信息处理模块102的核心中包括的a/d转换器。

通信模块103用于实现与上位机之间的通信,将识别结果发送至上位机。通信模块102与上位机之间的通信方式包括无线通信方式与有线通信方式,可以采用的无线通信方式包括zigbee、蓝牙、wifi、433mhz数传等方式,可以采用的有线通信方式包括485总线、can总线、互联网、电力载波等方式。通信模块103还可以接收上位机的相关工作指令,完成指定的工作任务。上位机可以是管理部门的服务器,也可以是各种工作站,或者是各种移动终端。

信息采集模块101、信息处理模块102、通信模块103的全部或者部分功能可以集成在一片soc上,减小识别装置体积,方便安装。

不同的电气负载设备具有不同的启动电流特征。如图2所示为启动冲击性电阻类负载单独启动的启动过程电流波形。启动冲击性电阻类负载包括白炽灯,采用钨、钼材料的高温电阻炉等。以白炽灯为例,白炽灯的灯丝通常用耐高温的金属钨制造,但金属钨的电阻随温度变化大,以rt表示钨丝在t℃时的电阻,以r0表示钨丝在0℃时的电阻,则两者有下述的关系

rt=r0(1+0.0045t)

例如,设白炽灯的灯丝(钨丝)在正常工作时的温度为2000℃,一只“220v100w”的白炽灯的灯丝在2000℃正常工作时的电阻为

其在不通电时0℃的电阻为

其在不通电时20℃的电阻为

r20=r0(1+0.0045t)=52.8ω

即白炽灯在启动通电的瞬间电流超过其额定电流的9倍,且最大启动电流发生在启动时刻。随着白炽灯钨丝温度的升高,白炽灯的负载电流按照指数规律减小,然后进入稳定状态。负载电流减小的速度与启动冲击性电阻类负载,即电阻丝的热惯性大小有关,白炽灯的热惯性小,负载电流减小的速度快;大型电阻炉电阻丝的热惯性大,负载电流减小的速度慢。

设电气负载稳态电流有效值为iw,且定义电气负载电流有效值进入电气负载稳态电流有效值的一个设定的相对误差范围之内并稳定在这个相对误差范围之内,则电气负载进入稳定状态。相对误差范围可以设定为10%,也可以设定为2%、5%、15%、20%等2%-20%之间的值。图2中,设定的相对误差范围为10%,当负载电流按照指数规律减小到其iw的10%误差范围时,如图2中的时刻ts,启动过程结束,即启动过程时间为ts。iw为有效值。

选择启动过程时间、启动电流最大值i*、启动电流最大值时间作为电气负载的启动电流特征;启动电流最大值为标么值,即启动电流最大值i*为电气负载的启动电流的最大有效值im与电气负载的稳态电流有效值iw的比值。

图2中,启动冲击性电阻类负载的启动过程时间为ts;启动电流最大值i*为im/iw;启动电流最大值时间为tm;考虑到测量滞后及电阻丝本身的小电感影响,ts和tm的测量值比0值稍大。

如图3所示为无启动冲击电阻类负载单独启动的启动过程电流波形。低温电阻炉等无启动冲击电阻类负载通常采用镍铬、铁铬铝等电热合金丝,其共同特点是电阻温度修正系数小,电阻值稳定。以牌号为cr20ni80的镍铬电热丝为例,其在1000℃时的电阻修正系数为1.014,即1000℃时相对于20℃时,牌号为cr20ni80的镍铬电热丝电阻只增加1.4%。因此,低温电阻炉等无启动冲击电阻类负载在通电启动时即进入稳定状态,启动过程时间ts=0s,考虑到测量滞后及电阻丝本身的小电感影响,ts的测量值比0值稍大;启动电流最大值i*=1,考虑到测量误差及干扰影响,i*的测量值在1附近;启动电流最大值时间tm=0s,考虑到测量滞后及电阻丝本身的小电感影响,tm的测量值比0值稍大。

如图4所示为异步电机类负载单独启动的启动过程电流波形,异步电机类负载包括单相异步电机、三相异步电机等。异步电机类负载既具有电感性负载特性,又具有反电动势负载特性。启动时刻,由于电感的作用,启动时刻的启动电流为0;随后电流迅速上升,在电机反电动势未建立之前,达到电流峰值im;此后,电机转速增加,电机负载电流逐步减小,直到进入稳定状态。图4中,异步电机类负载的启动过程时间为ts;启动电流最大值i*为im/iw;启动电流最大值时间为tm。

如图5所示为整流滤波类负载单独启动的启动过程电流波形,包括计算机,各种开关电源类负载,变频器负载等。整流滤波类负载因为对电容充电的影响,在启动瞬间会产生一个很大的浪涌电流,其峰值可达到稳态电流有效值iw的几倍至十几倍,时间为1至2个工频周期。图5中,整流滤波类负载的启动过程时间为ts,约1至2个工频周期,即其值通常在0.02-0.05s之间;启动电流最大值i*为im/iw;启动电流最大值时间为tm。

如图6所示为复合负载中无启动冲击电阻类负载的启动过程电流波形。在t0时刻之前,已经有一个负载处于稳定的运行状态之中,或者是有多个负载均处于稳定的运行状态之中,iw1为已经处于稳定运行状态之中负载的复合负载平均电流有效值。在t0时刻,有新的,无启动冲击电阻类负载被启动,其启动过程时间ts=0s,即t1与t0为同一时刻;考虑到测量滞后及电阻丝本身的小电感影响,ts的测量值比0值稍大;启动电流最大值时间tm=0s,即t2与t0为同一时刻;考虑到测量滞后及电阻丝本身的小电感影响,tm的测量值比0值稍大;从t0时刻开始的最近n个工频周期之内每个工频周期的复合负载电流有效值为iw2,iw2与复合负载平均电流有效值iw1之间的差值iw为当前启动的电气负载的稳态电流有效值;启动电流最大值时间所在工频周期的复合负载电流有效值im2与复合负载平均电流有效值iw1之间的差值im为电气负载的启动电流的最大有效值;从图6可知,iw与im相等,启动电流最大值i*=1,考虑到测量误差及干扰影响,i*的测量值在1附近。

如图7所示为复合负载中整流滤波类负载的启动过程电流波形。在t0时刻之前,已经有一个负载处于稳定的运行状态之中,或者是有多个负载均处于稳定的运行状态之中,iw1为已经处于稳定运行状态之中负载的复合负载平均电流有效值。在t0时刻,有新的,整流滤波类负载被启动;t2为当前启动的电气负载的最大值时刻,t2与t0时刻之间的差值为启动电流最大值时间tm;当前启动的电气负载进入稳定状态的时刻为t1,t1与t0时刻之间的差值为启动过程时间ts;从t0时刻开始的最近n个工频周期之内每个工频周期的复合负载电流有效值为iw2,iw2与复合负载平均电流有效值iw1之间的差值iw为当前启动的电气负载的稳态电流有效值;启动电流最大值时间所在工频周期的复合负载电流有效值im2与复合负载平均电流有效值iw1之间的差值im为电气负载的启动电流的最大有效值;启动电流最大值i*为im/iw。

获取电气负载的启动电流特征和电气负载的稳态电流频谱特征的方法是:

步骤1、信息处理模块102对负载电流进行连续采样,并将获取的复合负载的负载电流有效值作为第一负载电流有效值;复合负载的负载电流有效值为最近n个工频周期的复合负载电流有效值的平均值。

步骤2、当第一负载电流有效值小于等于一个较小的非负阈值ε1时,表明当前没有任何电气负载在运行;信息处理模块102继续对负载电流进行连续采样,直到当采样得到的负载电流值有效值开始大于ε1时,判定当前有电气负载开始启动运行并转向步骤4。由于在此之前没有电气负载运行,故复合负载平均电流有效值设定为0;复合负载基波平均幅值设定为0,谐波次数为m次的复合负载奇次谐波平均幅值设定为0;

当第一负载电流有效值大于ε1时,表明当前已经有复合负载处于运行状态中;信息处理模块102继续对复合负载的负载电流进行连续采样,连续获取复合负载的稳态电流频谱特征和第一负载电流有效值,对复合负载的稳态电流频谱特征和负载电流有效值进行加权融合得到复合负载的电流特征融合值并作为第一电流特征融合值,对第一电流特征融合值与平均电流特征融合值的差值进行判别,直到当第一电流特征融合值与平均电流特征融合值的差值大于一个非负阈值ε2时,判定当前有电气负载启动运行或者停止运行,转向步骤3。

步骤3、当第一负载电流有效值大于复合负载平均电流有效值时,判定当前有电气负载启动运行并转向步骤4;当第一负载电流有效值小于等于复合负载平均电流有效值时,判定当前有电气负载停止运行,或者是因干扰造成第一电流特征融合值与平均电流特征融合值的差值大于一个非负阈值ε2,此时重新测量计算有电气负载停止运行后仍然在运行的,或者是重新测量计算一直运行的复合负载的各项稳定值。对此时复合负载的负载电流进行连续采样,以工频周期为单位计算复合负载电流有效值并保存;计算最近n个工频周期的复合负载电流有效值的平均值并作为新的复合负载平均电流有效值;获取负载电流频谱特性,将负载电流频谱特性中谐波次数为m次的奇次谐波幅值作为新的谐波次数为m次的复合负载奇次谐波平均幅值;将负载电流频谱特性中的基波幅值作为新的复合负载基波平均幅值;各项新的稳定值计算完成后,转向步骤1。其中,m=3,…,m;所述m表示谐波最高次数且m大于等于3。

步骤4、信息处理模块102对复合负载的负载电流进行连续采样,且以工频周期为单位计算复合负载电流有效值并保存,采样的同时连续计算最近n个工频周期的复合负载电流有效值的平均值,将最近n个工频周期之内每个工频周期的复合负载电流有效值与复合负载平均电流有效值之间的差值作为最近n个工频周期之内每个工频周期的电气负载电流有效值,将该n个工频周期的复合负载电流有效值的平均值与复合负载平均电流有效值之间的差值作为该n个工频周期的电气负载电流有效值的平均值,信息处理模块102对最近n个工频周期之内的每个工频周期的电气负载电流有效值与该n个工频周期的电气负载电流有效值的平均值相比较,直到误差(或波动)幅度均小于设定的相对误差范围e时,判定当前启动的电气负载进入稳定状态,该最近n个工频周期的起始时刻为启动过程的结束时刻,记录该时刻为t1并转向步骤5。

步骤5、将最近n个工频周期的复合负载电流有效值的平均值作为新的复合负载平均电流有效值;对当前复合负载的稳态电流频谱特征和负载电流有效值进行加权融合得到电流特征融合值并作为平均电流特征融合值;将最近n个工频周期的电气负载电流有效值的平均值作为当前启动的电气负载的稳态电流有效值iw;将判定有电气负载开始启动运行时刻t0至最近n个工频周期起始时刻t1之间的时间作为当前启动的电气负载的启动过程时间ts;将t0至t1之内负载电流有效值最大的工频周期所在时刻记录为t2,将t0至t2之间的时间作为启动电流最大值时间tm;将启动电流最大值时间t2所在工频周期的电气负载电流有效值与电气负载的稳态电流有效值之间的比值作为启动电流最大值i*。

由于预先不知道当前启动电气负载的稳态电流有效值iw,因此,将n个工频周期,即一段持续时间tp之内波动范围小于设定的相对误差范围e时的负载电流有效值的平均值作为电气负载稳态电流有效值iw。由于普通电气负载的启动过程较快,所以,tp的取值范围为1-10s,典型取值是2s,相应的工频周期数量n的取值范围为50-500,n的典型取值是100。所述相对误差范围e的取值范围为2%-20%,e的典型取值是10%。

所述ε1为大于0的数值;当ε1取值特别小时,例如,ε1取值1ma时,所述识别装置不考虑待机情况,即认为待机也是电气负载的启动状态;当ε1取值较小但大于电气负载的待机电流时,例如,ε1取值20ma时,所述识别装置会将电气负载的待机状态认为是未启动状态,但同时也会的部分功率特别小的电气负载造成漏识别。ε2的作用是,当复合负载中有新的负载启动,或者是有负载停止运行时,负载电流有效值、各奇次谐波信号与基波之间的各个相对幅值均会发生变化,将负载电流频谱特性中谐波次数为m次的奇次谐波信号与基波之间的各个相对幅值,以及负载电流有效值进行加权求和,加权求和值为电流特征融合值后,电流特征融合值的变化超过ε2,则判别复合负载中有新的负载启动,或者是有负载停止运行。将负载电流频谱特性中谐波次数为m次的奇次谐波信号与基波之间的各个相对幅值,以及负载电流有效值进行加权求和的方法是:

q=α1·i+α3·a3+…+αm·am(1)

式(1)中,i为第一负载电流有效值时,q为第一电流特征融合值;i为复合负载平均电流有效值时,q为平均电流特征融合值;a3、…、am依次为负载电流频谱特性中谐波次数为3次至m次奇次谐波信号与基波之间的相对幅值;α1、α3、…、αm为加权系数;例如,复合负载中最小负载的额定有效值为0.2a时,可以取α1等于1,13、…、αm均等于0.1,ε2在0.1至0.2之间取值;例如,复合负载中最小负载的额定有效值为0.05a时,可以取α1、α3、…、αm均等于1,ε2在0.02至0.05之间取值;例如,复合负载中最小负载的额定有效值为3a时,可以取α1等于0.1,α3、…、αm均等于1,ε2在0.1至0.3之间取值;等等。

电气负载的稳态电流频谱特征和复合负载的稳态电流频谱特征由信息处理模块102控制信息采集模块101,通过以下步骤获得:

步骤i、获取复合负载的稳态电流信号,并将其转换为对应的稳态电流数字信号。

步骤ii、对稳态电流数字信号进行傅立叶变换,得到负载电流频谱特性;为保证傅立叶变换的顺利进行,在前述获取复合负载的稳态电流信号,并将其转换为对应的稳态电流数字信号的过程中,a/d转换器的精度和速度需要满足傅立叶变换的要求,采样频率可以设定为10khz,或者是其他数值;信息处理模块102对采集到的稳态电流数字信号进行fft运算,计算其频谱。

步骤iii、将负载电流频谱特性中谐波次数为m次的奇次谐波幅值与基波幅值之间的相对比值作为复合负载的稳态电流频谱特征;将负载电流频谱特性中谐波次数为m次的奇次谐波幅值依次减去谐波次数为m次的复合负载奇次谐波平均幅值作为电气负载的m次的奇次谐波幅值;将负载电流频谱特性中的基波幅值减去复合负载基波平均幅值作为电气负载的基波幅值;将电气负载的m次的奇次谐波幅值与电气负载的基波幅值之间的相对比值作为电气负载的稳态电流频谱特征;将负载电流频谱特性中谐波次数为m次的奇次谐波幅值作为新的谐波次数为m次的复合负载奇次谐波平均幅值;将负载电流频谱特性中的基波幅值作为新的复合负载基波平均幅值。

谐波次数为m次的复合负载奇次谐波平均幅值,以及复合负载基波平均幅值是在当前电气负载未启动时的所有已经被启动的负载(复合负载)的各次谐波幅值,以及基波幅值,其特例是之前没有负载被启动运行,各次谐波幅值以及基波幅值均为0。

图8为识别装置进行电气负载启动运行识别的流程图,识别装置进行电气负载启动运行识别的方法是:

步骤a、等待新的电气负载启动;

步骤b、获取电气负载的启动电流特征和电气负载的稳态电流频谱特征;

步骤c、将电气负载的启动电流特征和电气负载的稳态电流频谱特征作为分类器的输入特征,由分类器进行电气负载启动运行识别;

步骤d、输出电气负载启动运行识别结果。

步骤c中的分类器为基于隶属偏离平方和的改进决策树分类器,其构建流程如下:

步骤⑴、获取多组电气负载的输入特征样本,随机选择其中部分输入特征样本作为训练数据样本,其他输入特征样本作为测试数据样本;对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征。

步骤⑵、根据电气负载区间化输入特征的重叠状态,找到当前节点待选择输入特征的中间分裂点,将区间化输入特征的区间分段化。

步骤⑶、计算当前节点待选择输入特征的信息量ix(p,n)。

步骤⑷、计算当前节点待判别(待识别)电气负载的每个待选择输入特征的信息熵ex(hi)。

步骤⑸、计算当前节点的每个待选择输入特征的总信息熵e(x)。

步骤⑹、计算当前节点的每个待选择输入特征的信息增益gain(x)。

步骤⑺、选择当前节点待选择输入特征中信息增益最大的输入特征作为当前节点的判别属性,形成分支完成当前节点的建立;递归调用步骤⑵到步骤⑺,完成所有判别分支的建立。

步骤⑻、对不是纯净集的输出节点,分别计算所有输入特征针对该节点所有待识别电气负载类型的隶属偏离平方和,采用隶属偏离平方和作为该节点的判别属性,选择其中隶属偏离平方和最小的电气负载类型输出。

用一个简单的4类负载分类实例来说明决策树分类器的构建过程。该4类负载分类实例针对包括启动冲击性电阻类、无启动冲击电阻类、异步电机类、整流滤波类的4类负载,采用启动电流最大值i*、启动电流最大值时间tm、启动过程时间ts、3次谐波相对幅值a3、5次谐波相对幅值a5、7次谐波相对幅值a7作为输入特征进行电气负载启动运行识别。

步骤⑴中,获取多组电气负载的输入特征样本,是指对每一种相同类别中的各种电气负载均进行数据采集并采用滤波等处理手段,减小各种干扰给测量数据带来的误差影响,例如,剔除粗大误差,减小系统误差和偶然误差的影响,所获取的输入特征样本。例如,每一种相同类别的电气负载均获取200组以上的输入特征样本,或者是每一种相同类别的电气负载均获取500组以上的输入特征样本,等等。随机选择其中部分输入特征样本作为训练数据样本,其他输入特征样本作为测试数据样本,例如,每一种相同类别的电气负载均获取600组的输入特征样本,每一种相同类别的电气负载均随机选择其中的300组输入特征样本作为训练数据样本,其他的300组输入特征样本作为测试数据样本。

步骤⑴中,对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征,是指将每个输入特征的训练数据样本中的最小值作为区间化输入特征的下限值,将每个输入特征的训练数据样本中的最大值作为区间化输入特征的上限值。区间化之后的输入特征减小了训练数据样本大小对决策树分类的影响,能够很大程度上弥补样本问题造成的训练数据缺失,提高了决策树分类器的分类准确率。表一的区间化输入特征实例1即为4类负载分类实例的区间化结果。在4类负载分类实例中,对4类负载分别获取500组的输入特征样本,每一种相同类别的电气负载均随机选择其中的100组输入特征样本作为训练数据样本。在启动冲击性电阻类负载的100组输入特征训练数据样本中,其启动电流最大值i*的最大值为9.82,最小值为8.51,则启动电流最大值i*的区间化输入特征δi*为8.51~9.82;其启动电流最大值时间tm的最大值为0.04,最小值为0.01,启动电流最大值时间tm的区间化输入特征δtm为0.01~0.04;其3次谐波相对幅值a3的最大值为2.22,最小值为0.70,3次谐波相对幅值a3的区间化输入特征δa3为0.70~2.22;等等;表一中其他数据区间的含义相同,例如,整流滤波类负载7次谐波相对幅值a7的最大值为7.17,最小值为0.89,则其7次谐波相对幅值a7的区间化输入特征δa7为0.89~7.17。表一中,各次谐波相对幅值数据是谐波幅值与基波幅值之间的百分比,例如,3次谐波相对幅值a3的最大值为2.22,是指3次谐波幅值为其基波幅值的2.22%。理论上,冲击性电阻类的最大值应该在启动时刻,即tm的理论值为0;实际的区间化输入特征δtm为0.01~0.04,是测量导致的时间滞后所致,因为交流信号的有效值无法直接测量,需要进行周期区间测量并间接计算;无冲击电阻类负载等的δtm,以及δts等也有类似的情况。

表一区间化输入特征实例1

步骤⑵中每个特征参数的中间分裂点,是指每个区间化输入特征中,能够将当前节点需要分类的电气负载类型区分的分界点。根节点的待选择作为判别属性的输入特征包括所有6种输入特征,图9为表一区间化输入特征实例1中,在根节点针对启动电流最大值i*的区间化输入特征δi*进行区间分段化的示意图。区间1.01~1.35只属于无启动冲击电阻类负载,没有与其他负载的区间化输入特征重叠,区间1.35~1.41为无启动冲击电阻类负载与整流滤波类负载的区间化输入特征重叠,所以1.35为根节点区间化输入特征δi*的一个中间分裂点;区间1.41~2.31只属于整流滤波类负载,没有与其他负载的区间化输入特征重叠,所以2.31为根节点区间化输入特征δi*的一个中间分裂点;区间2.31~4.55为整流滤波类负载与异步电机类的区间化输入特征重叠,所以2.31为根节点区间化输入特征δi*的一个中间分裂点;区间4.55~8.51只属于异步电机类负载,没有与其他负载的区间化输入特征重叠,所以2.31为根节点区间化输入特征δi*的一个中间分裂点;区间8.51~9.82为启动冲击性电阻类负载与异步电机类的区间化输入特征重叠,所以8.51为根节点区间化输入特征δi*的一个中间分裂点;区间9.82~14.22只属于异步电机类负载,没有与其他负载的区间化输入特征重叠,所以9.82为根节点区间化输入特征δi*的一个中间分裂点。

步骤⑶中,计算当前节点每个输入特征的信息量的方法是:

式(2)中的x代表该信息量所针对的输入特征,x包括且只包括属于当前节点待选择作为判别属性的输入特征;p为正例集,即p为在当前节点待判别电气负载类型中能准确地区分出电气负载类型的该负载特征参数区间范围的总和;n为反例集,即n为在当前节点待判别电气负载类型中不能准确地区分出电气负载类型的该负载特征参数区间范围的总和。

在4类负载分类实例中,根节点的x包括i*、tm、ts、a3、a5、a7。以计算根节点输入特征i*的信息量为例,从图9可知,区间范围p包括:能准确区分无启动冲击电阻类负载的区间1.01~1.35,能准确区分整流滤波类负载的区间1.41~2.31,能准确区分异步电机类负载的区间4.55~8.51和区间9.82~14.22,区间p的大小为:

p=(1.35-1.01)+(2.31-1.41)+(8.51-4.55)+(14.22-9.82)=9.6

区间范围n包括:区间1.35~1.41为无启动冲击电阻类负载与整流滤波类负载的区间化输入特征重叠,区间2.31~4.55为整流滤波类负载与异步电机类的区间化输入特征重叠,区间8.51~9.82为启动冲击性电阻类负载与异步电机类的区间化输入特征重叠,n的大小为:

n=(1.41-1.35)×2+(4.55-2.31)×2+(9.82-8.51)×2=7.22

式中各区间值乘以2,是因为各区间参数均有2种负载类型的参数重叠;如果是3种负载类型的参数重叠,则相应的区间需要乘以3,以此类推。将根节点输入特征i*的p、n代入式(2),计算得到根节点输入特征i*能做出正确的类型判别所需的信息量ii*(p,n)为0.98。

根节点需要计算所有输入特征(即所有属性)的信息量。以计算根节点输入特征ts的信息量为例,图10为表一区间化输入特征实例1中,在根节点针对区间化输入特征δts进行区间分段化的示意图,在步骤⑵所产生的中间分裂点分别为0.12、0.17、0.31、0.51和0.95。从图10可知,区间范围p包括:能准确区分无启动冲击电阻类负载的区间0.12~0.17,能准确区分异步电机类负载的区间0.31~0.51,能准确区分启动冲击性电阻类的区间0.95~6.16,区间p的大小为:

p=(0.17-0.12)+(0.51-0.31)+(6.16-0.95)=5.46

区间范围n包括:区间0.02~0.12为无启动冲击电阻类负载与整流滤波类负载的区间化输入特征重叠,区间0.51~0.95为启动冲击性电阻类负载与异步电机类的区间化输入特征重叠,n的大小为:

n=(0.12-0.02)×2+(0.95-0.51)×2=1.08

将根节点输入特征ts的p、n代入式(2),计算得到根节点输入特征ts能做出正确的类型判别所需的信息量为0.65。采用同样方法,可以计算出根节点其他输入特征启动电流最大值时间tm、3次谐波相对幅值a3、5次谐波相对幅值a5、7次谐波相对幅值a7的信息量。

当前节点不是根节点时,无需计算所有当前节点之前所有父节点中已经被作为判别属性使用的输入特征的信息量。例如,假设根节点使用的判别属性(即分类属性)为输入特征启动电流最大值时间tm时,根节点的下一级子节点的待选择输入特征包括启动电流最大值i*、启动过程时间ts、3次谐波相对幅值a3、5次谐波相对幅值a5、7次谐波相对幅值a7等5种输入特征,只需要计算该5种输入特征的信息量,无需计算已经被作为判别属性使用的启动电流最大值时间tm的信息量。在进行子节点输入特征的信息量计算时,其正例集、反例集中不包括在当前节点之前已经被排除的电气负载类型,而只包括属于该节点待判别的电气负载类型。例如,假设根节点使用的判别属性为输入特征tm,在根节点,δtm的中间分裂点包括0.03、0.04;设该子节点的代号为q,其输入特征tm属性区间为0.01~0.03,该属性区间明确排除的电气负载类型为异步电机类负载,只属于该节点待判别的电气负载类型为无启动冲击电阻类负载、启动冲击性电阻类负载和整流滤波类负载。图11为表一区间化输入特征实例1中,排除异步电机类负载后针对区间化输入特征δts进行区间分段化的示意图,在步骤⑵所产生的中间分裂点分别为0.12、0.17和0.51。从图11可知,ts的区间范围p包括:能准确区分无启动冲击电阻类负载的区间0.12~0.17和能准确区分启动冲击性电阻类负载的区间0.51~6.16,区间p的大小为:

p=(0.17-0.12)+(6.16-0.51)=5.7

区间范围n包括:区间0.02~0.12为无启动冲击电阻类负载与整流滤波类负载的区间化输入特征重叠,n的大小为:

n=(0.12-0.02)×2=0.2

将该子节点输入特征ts的p、n代入式(2),计算得到该子节点输入特征ts能做出正确的类型判别所需的信息量为0.21。图12为表一区间化输入特征实例1中,排除异步电机类负载后针对区间化输入特征δa7进行区间分段化的示意图,在步骤⑵所产生的中间分裂点分别为0.23、0.29、0.34和0.89。从图12可知,a7的区间范围p包括:能准确区分无启动冲击电阻类负载的区间0.12~0.17和能准确区分启动冲击性电阻类负载的区间0.20~0.23和0.29~0.34,以及能准确区分整流滤波类负载的区间0.89~7.17,区间p的大小为:

p=(0.23-0.2)+(0.34-0.29)+(7.17-0.89)=6.36

区间范围n包括:区间0.23~0.29为无启动冲击电阻类负载与启动冲击性电阻类负载的区间化输入特征重叠,n的大小为:

n=(0.29-0.23)×2=0.12

将该子节点输入特征a7的p、n代入式(2),计算得到该子节点输入特征a7能做出正确的类型判别所需的信息量为0.13。

采用同样方法,可以计算出该子节点其他输入特征启动电流最大值i*、3次谐波相对幅值a3、5次谐波相对幅值a5的信息量。其他子节点的计算方法相同。

步骤⑷中,计算当前节点待判别电气负载的每个输入特征的信息熵e(hi)的方法是:

式(3)中的x代表该信息熵所针对的输入特征,x包括且只包括属于当前节点待选择的输入特征;i代表该信息熵所针对的电气负载类型,i包括且只包括属于当前节点待判别的电气负载类型;pi为该电气负载类型所包含的正例,即输入特征x的区间范围hi中与该节点待选择的其他输入特征均不重叠的区间范围;ni为该电气负载类型所包含的反例,即输入特征x的区间范围hi中与当前节点待选择的其他输入特征相重叠的区间范围。

在4类负载分类实例中,计算根节点的信息熵时,需要区分4种电气负载类型,i等于1、2、3、4分别代表启动冲击性电阻类负载、无启动冲击电阻类负载、异步电机类负载、整流滤波类负载;需要针对6种输入特征分别计算4种电气负载类型的信息熵,x包括i*、tm、ts、a3、a5、a7。以输入特征i*作为决策树的根时,i*将电气负载类型的区间范围h分为4个子集,包括启动冲击性电阻类负载的区间范围h1(8.51~9.82),无启动冲击电阻类负载的区间范围h2(1.01~1.41),异步电机类负载的区间范围h3(2.31~14.22),整流滤波类负载的区间范围h4(1.31~4.55);每种电气负载类型hi中含有pi个正例和ni个反例,根节点针对输入特征i*时各类电气负载hi的信息熵为:

根节点输入特征i*的启动冲击性电阻类负载的区间范围h1(8.51~9.82)全部被包括在异步电机类负载h3(2.31~14.22)之中,故p1=0,n1=9.82-8.51=1.31,将p1、n1代入式(3)中,有

即根节点输入特征i*的启动冲击性电阻类负载的信息熵

根节点输入特征i*的无启动冲击电阻类负载的区间范围h2(1.01~1.41)与另外3种负载类型均不重叠的区间是(1.01~1.35),即p2=1.35-1.01=0.34,而区间(1.35~1.41)则与整流滤波类负载重叠,即n2=1.41-1.35=0.06,将p2、n2代入式(3)中,得到根节点输入特征i*的无启动冲击电阻类负载的信息熵

根节点输入特征i*的异步电机类负载的区间范围h3(2.31~14.22)中,与另外3种负载类型均不重叠的区间是p3=(14.22-9.82)+(8.51-4.55)=8.36,而区间(2.31~4.55)与整流滤波类负载重叠,区间(8.51~9.82)与启动冲击性电阻类负载重叠,即n3=(4.55-2.31)+(9.82-8.51)=3.55,将p3、n3代入式(3)中,得到根节点输入特征i*的异步电机类负载的信息熵同样地,可以计算出根节点输入特征i*的整流滤波类负载的信息熵

以输入特征tm作为决策树的根时,tm将电气负载类型的区间范围h分为4个子集,包括启动冲击性电阻类负载的区间范围h1(0.01~0.04),无启动冲击电阻类负载的区间范围h2(0.01~0.03),异步电机类负载的区间范围h3(0.03~0.12),整流滤波类负载的区间范围h4(0.01~0.04);每种电气负载类型hi中含有pi个正例和ni个反例,根节点针对输入特征tm时各类电气负载hi的信息熵为:

根节点输入特征tm的启动冲击性电阻类负载的区间范围h1(0.01~0.04)与整流滤波类负载的区间范围h4(0.01~0.04)完全重叠,无启动冲击电阻类负载的区间范围h2(0.01~0.03)被完全包括在启动冲击性电阻类负载的区间范围h1(0.01~0.04)中,故根节点输入特征tm的启动冲击性电阻类负载的信息熵无启动冲击电阻类负载的信息熵整流滤波类负载的信息熵均为0。

根节点输入特征tm的异步电机类负载的区间范围h3(0.03~0.12)中,与另外3种负载类型均不重叠的区间是(0.04~0.12),故p3=0.12-0.04=0.08,而区间(0.03~0.04)与其他类负载重叠,即n3=0.04-0.03=0.01,将p3、n3代入式(3)中,得到根节点输入特征tm的异步电机类负载的信息熵

以输入特征ts作为决策树的根时,依据上述方法,计算出根节点输入特征ts的启动冲击性电阻类负载的信息熵无启动冲击电阻类负载的信息熵异步电机类负载的信息熵整流滤波类负载的信息熵依据上述方法,同样能够计算出根节点输入特征3次谐波相对幅值a3、5次谐波相对幅值a5、7次谐波相对幅值a7分别针对启动冲击性电阻类负载、无启动冲击电阻类负载、异步电机类负载的信息熵、整流滤波类负载的信息熵。

当前节点不是根节点时,无需计算所有当前节点之前的所有父节点中已经被作为判别属性使用的输入特征的信息熵。例如,假设根节点使用的判别属性为输入特征启动电流最大值时间tm时,根节点的下一级子节点的待选择输入特征包括启动电流最大值i*、启动过程时间ts、3次谐波相对幅值a3、5次谐波相对幅值a5、7次谐波相对幅值a7等5种输入特征,只需要计算该5种输入特征的信息熵,无需计算已经被作为判别属性使用的启动电流最大值时间tm的信息熵。在进行子节点输入特征的信息熵计算时,其正例集pe、反例集ne不包括在当前节点之前已经被排除的电气负载类型,而只包括属于该节点待判别的电气负载类型,当前节点之前已经被排除的电气负载类型针对该节点所有待选择输入特征的信息熵直接定义为0。例如,假设根节点使用的判别属性为输入特征tm,在根节点,δtm的中间分裂点包括0.03、0.04;设子节点q的输入特征tm属性区间为0.01~0.03,该属性区间明确排除的电气负载类型为异步电机类负载,只属于该节点待判别的电气负载类型为启动冲击性电阻类负载、无启动冲击电阻类负载和整流滤波类负载,则该子节点只需要区分包括启动冲击性电阻类负载、无启动冲击电阻类负载和整流滤波类负载在内的3种电气负载类型,需要针对启动电流最大值i*、启动过程时间ts、3次谐波相对幅值a3、5次谐波相对幅值a5、7次谐波相对幅值a7等5种输入特征分别计算启动冲击性电阻类负载、无启动冲击电阻类负载和整流滤波类负载的信息熵。采用式(3)计算时,i等于1、2、4分别代表启动冲击性电阻类负载、无启动冲击电阻类负载、整流滤波类负载;x包括i*、ts、a3、a5、a7;均被直接定义为0。

以输入特征ts作为该子节点q的判别属性为例,此时ts将电气负载类型的区间范围h分为3个子集,包括启动冲击性电阻类负载的区间范围h1(0.51~6.16),无启动冲击电阻类负载的区间范围h2(0.02~0.17),整流滤波类负载的区间范围h4(0.02~0.12);输入特征a7的启动冲击性电阻类负载的区间范围h1(0.51~6.16)与另外2种负载类型均不重叠,即p1=5.65,n1=0,将p1、n1代入式(3)中,得到该子节点输入特征ts的启动冲击性电阻类负载的信息熵输入特征ts的无启动冲击电阻类负载的区间范围h2(0.02~0.17)中,与另外2种负载类型均不重叠的区间是(0.12~0.17),即p2=0.05,n2=0.10,将p2、n2代入式(3)中,得到该子节点输入特征ts的无启动冲击电阻类负载的信息熵整流滤波类负载的区间范围h4(0.02~0.12)全部被包含在无启动冲击电阻类负载的区间范围h2(0.02~0.17)中,故p4=0,n4=0.1,将p4、n4代入式(3)中,得到该子节点输入特征a7的整流滤波类负载的信息熵

以输入特征a7作为该节点q的判别属性为例,此时a7将电气负载类型的区间范围h分为3个子集,包括启动冲击性电阻类负载的区间范围h1(0.20~0.34),无启动冲击电阻类负载的区间范围h2(0.23~0.29),整流滤波类负载的区间范围h4(0.89~7.17);输入特征a7的启动冲击性电阻类负载的区间范围h1(0.20~0.34)中,与另外2种负载类型均不重叠的区间是(0.20~0.23)和(0.29~0.34),即p1=0.08,与无启动冲击电阻类负载重叠的区间是(0.23~0.29),即n1=0.06,将p1、n1代入式(3)中,得到该子节点输入特征a7的启动冲击性电阻类负载的信息熵输入特征a7的无启动冲击电阻类负载的区间范围h2(0.23~0.29)中,没有与另外2种负载类型均不重叠的区间,即p2=0,h2(0.23~0.29)被全部包括在启动冲击性电阻类负载的区间范围中,即n2=0.06,将p2、n2代入式(3)中,得到该子节点输入特征a7的启动冲击性电阻类负载的信息熵整流滤波类负载的区间范围h4(0.89~7.17)全部与另外2种负载类型均不重叠,故p4=7.17-0.89=6.28,n4=0,将p4、n4代入式(3)中,得到该子节点输入特征a7的整流滤波类负载的信息熵采用同样方法,可以计算出该子节点其他输入特征启动电流最大值i*、启动过程时间ts、3次谐波相对幅值a3、5次谐波相对幅值a5分别针对启动冲击性电阻类负载、无启动冲击电阻类负载、整流滤波类负载的信息熵。其他子节点的计算方法相同。

步骤⑸中,计算当前节点的每个待选择输入特征的总信息熵e(x)的方法是:

式(4)中的x代表该信息熵(总信息熵)所针对的输入特征,x包括且只包括属于当前节点待选择作为判别属性的输入特征;i代表待识别的某种电气负载类型,k代表需分类的电气负载类型的种类数,在4类负载分类实例中,k等于4;pi为与i所代表电气负载类型所包含的正例,即输入特征x的区间范围hi中与该节点待选择的其他输入特征均不重叠的区间范围;ni为与i所代表电气负载类型所包含的反例,即输入特征x的区间范围hi中与当前节点待选择的其他输入特征相重叠的区间范围;pi+ni为i所代表电气负载类型中输入特征x的区间范围大小;p为在该节点待判别电气负载类型中能准确地区分出电气负载类型的该负载特征参数区间范围的总和;n为在该节点待判别电气负载类型中不能准确地区分出电气负载类型的该负载特征参数区间范围的总和。

当前节点以根节点为例,i等于1、2、3、4分别代表启动冲击性电阻类负载、无启动冲击电阻类负载、异步电机类负载、整流滤波类负载。以i*作为根节点的判别属性时,分别等于0、0.61、0.89、0.87,其总信息熵e(i*)为

以tm作为根节点的判别属性时,分别等于0、0、0.51、0,其总信息熵e(tm)为

以ts为根节点判别属性的总信息熵e(ts)为

采用同样方法,可以分别计算出根节点其他输入特征,即3次谐波相对幅值a3、5次谐波相对幅值a5和7次谐波相对幅值a7的总信息熵。

当前节点以前述代号为q的子节点为例,i等于1、2、3、4分别代表启动冲击性电阻类负载、无启动冲击电阻类负载、异步电机类负载、整流滤波类负载。此时,分别计算出等于0、0.92、0,被定义为0,计算信息量时的p、n分别为5.7、0.2,则以ts为该子节点q判别属性的总信息熵e(ts)为

分别计算出等于0.99、0、0,被定义为0,计算信息量时的p、n分别为6.36、0.12,则以a7为该子节点q判别属性的总信息熵e(a7)为

采用同样方法,可以分别计算出该节点其他输入特征,即启动电流最大值i*、3次谐波相对幅值a3和5次谐波相对幅值a5的总信息熵。其他子节点的计算方法相同。

步骤⑹中,计算当前节点的每个待选择输入特征的信息增益gain(x)的方法是:

gain(x)=ix(p,n)-e(x)(5)

式(5)中的x代表该信息熵(总信息熵)所针对的输入特征,x包括且只包括属于当前节点待选择作为判别属性的输入特征。

以当前节点是根节点为例,以i*作为根节点的判别属性时,其信息增益gain(i*)为

以ts作为根节点的判别属性时,其信息增益gain(i*)为

采用同样的方法,可以计算出根节点分别以tm、a3、a5、a7作为根节点判别属性时的信息增益。

以当前节点是前述子节点q为例,以ts为该子节点的判别属性时,其信息增益gain(ts)为

以a7为该子节点q的判别属性时,其信息增益gain(a7)为

采用同样的方法,可以计算出子节点q分别以i*、a3、a5作为该子节点判别属性时的信息增益。其他子节点的计算方法相同。

步骤⑺中,形成分支完成当前节点的建立时,分支数量与被选择作为判别属性的区间化输入特征被步骤⑵中得到的中间分裂点,进行区间分段化得到的区间分段数量有关。以当前节点是根节点为例,如图9所示,决策树最终以i*作为根节点的判别属性时,区间分段数量为7段,形成的分支数量为9个,其中有2个为i*在δi*之外所形成的分支,实际分类时,由于采样干扰导致出现误差,或者是训练数据不完整,造成待判别电气负载数据的i*小于1.01,或者是大于14.22时,由其他输入特征实现分类;如图10所示,决策树最终以ts作为根节点的判别属性时,区间分段数量为6段,形成的分支数量为8个,其中的3个分支为训练数据中,没有任何电气负载类型有数据分布的区间段所形成的分支,实际分类时,由于采样干扰导致出现误差,或者是训练数据不完整,造成待判别电气负载数据的ts采样值落于区间段(0.17~0.31),或者是小于0.02,或者是大于6.16时,由其他输入特征实现分类。以当前节点是前述子节点q为例,如图11所示,以ts作为该子节点的判别属性时,区间分段数量为4段,形成的分支数量为6个;如图12所示,以a7作为该子节点的判别属性时,区间分段数量为5段,形成的分支数量为7个。

步骤⑺中,完成所有判别分支建立的判别依据是,新节点没有未使用的输入特征,或分类结果为确定的电气负载类型,则已经完成所有判别分支的建立。

步骤⑻中,不是纯净集的输出节点,指的是该输出节点输出的识别结果不是唯一的电气负载类型,而是为2种或者2种以上电气负载类型,或者未能给出识别的电气负载类型。

2种情况会导致最终节点输出的识别结果不是唯一的电气负载类型。一是2种或者是2种以上电气负载类型的所有区间化输入特征均存在重叠区域,分类时,所有输入特征均落入相应的重叠区域;例如,在表一给出的4类负载分类实例数据中,启动冲击性电阻类负载与异步电机类负载在启动电流最大值i*、启动电流最大值时间tm、启动过程时间ts、3次谐波相对幅值a3、5次谐波相对幅值a5、7次谐波相对幅值a7等6个区间化输入特征均存在重叠区域,δi*的重叠区域是(8.51~9.82),δtm的重叠区域是(0.03~0.04),δts的重叠区域是(0.51~0.95),δa3的重叠区域是(0.86~2.22),δa5的重叠区域是(0.69~0.86),δa7的重叠区域是(0.29~0.34),设输入特征i*、tm、ts、a3、a5、a7的实际输入值分别是9、0.032、0.7、1.2、0.75、0.3时,无法完成分类。另外一种是2种或者是2种以上电气负载类型的部分区间化输入特征存在重叠区域,分类时,输入特征中的该部分输入特征均落入相应的重叠区域,而另外的输入特征均落入相应的区间化输入特征的有效区间之外;例如,在表一给出的4类负载分类实例数据中,异步电机类负载与整流滤波类负载中,δi*的重叠区域是(2.31~4.55),δtm的重叠区域是(0.03~0.04),δa3的重叠区域是(3.90~8.14),δa5的重叠区域是(1.17~3.78),δa7的重叠区域是(0.89~2.23)),输入特征i*、tm、a3、a5、a7的实际输入值分别是3.1、0.036、5.2、2.75、1.3,均在相应的重叠区域,而输入特征的实际输入值是0.18,落入相应的输入特征的有效区间之外时,无法完成分类。

分别计算所有输入特征针对该节点所有待识别电气负载类型的隶属偏离平方和,计算所有输入特征针对其中一种电气负载类型的隶属偏离平方和的方法是:分别计算所有输入特征在该种电气负载类型中的隶属偏离度,隶属偏离平方和为所有输入特征在该种电气负载类型中的隶属偏离度的平方和。

计算输入特征在电气负载类型中的隶属偏离度的方法是:

式(6)中的x代表该隶属偏离度所针对的输入特征,i代表所针对的电气负载类型,即ri(x)代表输入特征x在i所代表电气负载类型中的隶属偏离度;d0为输入特征x在i所代表电气负载类型区间化输入特征的区间中心值,d1为输入特征x在i所代表电气负载类型区间化输入特征的区间下限值,d为输入特征x的实际输入值。

例如,设输入特征i*、tm、ts、a3、a5、a7的实际输入值分别是9、0.032、0.7、1.2、0.75、0.3;启动冲击性电阻类负载中δi*的区间中心值为9.165,下限值为8.51,此时启动冲击性电阻类负载中i*的隶属偏离度是:

启动冲击性电阻类负载中δtm的区间中心值为0.025,下限值为0.01,此时启动冲击性电阻类负载中tm的隶属偏离度是:

异步电机类负载中δtm的区间中心值为0.075,下限值为0.03,此时异步电机类负载中tm的隶属偏离度是:

异步电机类负载中δa7的区间中心值为1.26,下限值为0.29,此时异步电机类负载中a7的隶属偏离度是:

采用同样的方法,可以计算出此时启动冲击性电阻类负载中ts的隶属偏离度r1(ts),a3的隶属偏离度r1(a3),a5的隶属偏离度r1(a5),a7的隶属偏离度r1(a7),以及异步电机类负载中i*的隶属偏离度r3(i*),ts的隶属偏离度r3(ts),a3的隶属偏离度r3(a3),a5的隶属偏离度r3(a5)。所有输入特征针对启动冲击性电阻类负载的隶属偏离平方和为

r1=r12(i*)+r12(tm)+r12(ts)+r12(a3)+r12(a5)+r12(a7)

所有输入特征针对异步电机类负载的隶属偏离平方和为

r3=r32(i*)+r32(tm)+r32(ts)+r32(a3)+r32(a5)+r32(a7)

依据实际的输入特征进行分类,当输入的所有输入特征均处于重叠区域,决策树无法利用中间分裂点实现分类时,若r1比r3小,则选择启动冲击性电阻类负载为当前实际输入特征所对应的输出类型;若r3比r1小,则选择异步电机类负载为当前实际输入特征所对应的输出类型。

例如,设输入特征i*、tm、ts、a3、a5、a7的实际输入值分别是3.1、0.036、0.18、5.2、2.75、1.3;异步电机类负载中δtm的区间中心值为0.075,下限值为0.03,此时异步电机类负载中tm的隶属偏离度是:

异步电机类负载中δts的区间中心值为0.63,下限值为0.31,此时异步电机类负载中ts的隶属偏离度是:

整流滤波类负载中δi*的区间中心值为2.95,下限值为1.35,此时整流滤波类负载中i*的隶属偏离度是:

整流滤波类负载中δts的区间中心值为0.07,下限值为0.02,此时整流滤波类负载中ts的隶属偏离度是:

采用同样的方法,可以计算出此时异步电机类负载中i*的隶属偏离度r3(i*),a3的隶属偏离度r3(a3),a5的隶属偏离度r3(a5),a7的隶属偏离度r3(a7),以及整流滤波类负载中tm的隶属偏离度r4(tm),a3的隶属偏离度r4(a3),a5的隶属偏离度r4(a5),a7的隶属偏离度r4(a7)。所有输入特征针对异步电机类负载的隶属偏离平方和为

r3=r32(i*)+r32(tm)+r32(ts)+r32(a3)+r32(a5)+r32(a7)

针对整流滤波类负载的隶属偏离平方和为

r4=r42(i*)+r42(tm)+r42(ts)+r42(a3)+r42(a5)+r42(a7)

此时,若r4比r3小,则选择整流滤波类负载为当前实际输入特征所对应的输出类型;若r3比r4小,则选择异步电机类负载为当前实际输入特征所对应的输出类型。分类过程中,当某个输入特征实际值离区间中心值越远,则其隶属偏离度越大;输入特征实际值等于区间中心值时,隶属偏离度等于0;输入特征实际值等于区间上限值或者下限值时,隶属偏离度等于1,输入特征实际值落入相应的输入特征的有效区间之外时,隶属偏离度大于1,其对隶属偏离平方和增加的影响也加大。选择求隶属偏离度的平方和,可以让输入特征离区间中心值越近,在隶属偏离平方和中起的作用越小,相应电气负载类型被选择的机会就越大。输入特征离区间中心值越远,包括落入输入特征的有效区间之外越远,则其在隶属偏离度平方和中起的作用越大,相应电气负载类型被选择的机会就越小。

上述决策树分类器的构建过程中,步骤⑴至步骤⑺构建了一个基本决策树分类器,步骤⑻在基本决策树分类器的基础上进行扩充,构建了一个基于隶属偏离平方和的改进决策树分类器,对无法直接利用具有明确分界的中间分裂点实现分类时,按照正态分布法则,输入特征离中心近,隶属偏离度值大(隶属度高),通过分析、判别所有输入特征的综合隶属特性,采用隶属偏离平方和作为其判别属性,实现电气负载类型的分类。

为方便进行计算与说明,4类负载分类实例比较简单。在无启动冲击电阻类负载、启动冲击性电阻类负载、异步电机类负载和整流滤波类负载之外,电气负载类型还有阻感类负载、直流电机类负载等;另外,整流滤波类负载还可以进一步细分为计算机类负载、开关电源类负载、变频器类负载等,异步电机类负载可以进一步细分为鼠笼式异步电机类负载、绕线式异步电机类负载等。当需要分类的电气负载类型种类增加时,区间化输入特征均存在重叠区域的情况更加明显与复杂,此时,仅依靠上述扩展决策树分类器,无法得到很好的分类效果。为达到更好的分类效果,输入特征还可以全部或者部分增加9次谐波相对幅值a9,11次谐波相对幅值a11,以及基波电压电流相位差等特征量;或者是在基于隶属偏离平方和的改进决策树分类器基础上,构建基于隶属偏离平方和和贝叶斯的复合优化决策树分类器。当输入特征中还需包括基波电压电流相位差时,信息采集模块还需要包括有电压传感器来检测负载电压,信息处理模块同时对负载电压与负载电流进行连续采样,并通过分析计算,得到基波电压电流相位差。

表二的区间化输入特征实例2为5类负载分类实例的区间化结果。5类负载包括启动冲击性电阻类、无启动冲击电阻类、异步电机类、整流滤波类、阻感类,采用启动电流最大值i*、启动电流最大值时间tm、启动过程时间ts、3次谐波相对幅值a3、5次谐波相对幅值a5、基波电压电流相位差φ作为输入特征进行电气负载启动运行识别。φ的单位是弧度,基波电压相位比电流相位超前时,φ为正值。

表二区间化输入特征实例2

以计算此时根节点输入特征i*的信息量为例,区间p的大小为:

p=(1.02-1.01)+(2.31-1.74)+(8.51-4.55)+(14.22-9.82)=9.94

区间范围n的大小为:

n=(1.35-1.02)×2+(1.41-1.35)×3+(1.74-1.41)×2+(4.55-2.31)×2+(9.82-8.51)×2=8.6

将此时根节点输入特征i*的p、n代入式(2),计算得到根节点输入特征i*能做出正确的类型判别所需的信息量为0.996。根节点其他输入特征,以及非根节点输入特征信息量同样可以计算出来。

根节点输入特征tm的阻感类负载的区间范围h5(0.02~0.34)中,与另外4种负载类型均不重叠的区间是p3=0.34-0.12=0.22,与另外4种负载类型重叠的区间是(0.01~0.12),n3=0.11,将p3、n3代入式(3)中,得到根节点输入特征tm的阻感类负载的信息熵根节点其他输入特征针对不同负载类型,以及非根节点输入特征针对不同负载类型的信息熵同样可以计算出来。

基于隶属偏离平方和和贝叶斯的复合优化决策树分类器的构建流程如下:

步骤⑴、获取多组电气负载的输入特征样本,随机选择其中部分输入特征样本作为训练数据样本,其他输入特征样本作为测试数据样本;对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征。

步骤⑵、根据电气负载区间化输入特征的重叠状态,找到当前节点待选择输入特征的中间分裂点,将区间化输入特征的区间分段化。

步骤⑶、计算当前节点待选择输入特征的信息量ix(p,n)。

步骤⑷、计算当前节点待判别电气负载的每个待选择输入特征的信息熵ex(hi)。

步骤⑸、计算当前节点的每个待选择输入特征的总信息熵e(x)。

步骤⑹、计算当前节点的每个待选择输入特征的信息增益gain(x)。

步骤⑺、选择当前节点待选择输入特征中信息增益最大的输入特征作为当前节点的判别属性,形成分支完成当前节点的建立;递归调用步骤⑵到步骤⑺,完成所有判别分支的建立。

步骤⑻、对不是纯净集的输出节点,分别计算所有输入特征针对该节点所有待识别电气负载类型的隶属偏离平方和,采用隶属偏离平方和作为该节点的判别属性,选择其中隶属偏离平方和最小的电气负载类型输出。

步骤⑼、采用步骤⑴获取的电气负载样本输入特征中的训练数据样本,训练并建立贝叶斯分类器。

步骤⑽、记录步骤⑻中所有采用隶属偏离平方和作为节点判别属性的节点,准备进行分类优化。

步骤⑾、选择一个采用隶属偏离平方和作为节点判别属性,未进行分类优化的节点进行分类优化,方法是,将步骤⑴获取的电气负载样本输入特征中的测试数据样本依次输入至复合优化决策树分类器,统计该节点采用隶属偏离平方和作为节点判别属性时的总电气负载识别准确率;该节点使用贝叶斯分类器分类,替代该节点采用隶属偏离平方和作为节点判别属性的方法,将步骤⑴获取的电气负载样本输入特征中的测试数据样本依次输入至复合优化决策树分类器,统计该节点采用贝叶斯分类器分类时的总电气负载识别准确率;选择采用隶属偏离平方和作为节点判别属性和使用贝叶斯分类器分类两者中总电气负载识别准确率高的方法作为该节点进行电气负载启动运行识别的方法。

步骤⑿、若步骤⑻中所有采用隶属偏离平方和作为节点判别属性的节点未全部完成分类优化,返回步骤⑾;若步骤⑻中所有采用隶属偏离平方和作为节点判别属性的节点全部完成分类优化,完成复合优化决策树分类器的构造。

贝叶斯分类器可以选择nbc分类器(朴素贝叶斯分类器)、tan分类器(树扩展朴素贝叶斯分类器)、ban分类器(增强的贝叶斯分类器)等三种贝叶斯分类器之中的一种。以朴素贝叶斯分类器为例,其定义如下:

⑴设x={a1,a2,…,am}为一个待识别项,而每个a为x的一个特征属性;

⑵有类别集合c={y1,y2,…,yn};

⑶计算p(y1|x),p(y2|x),…,p(yn|x);

⑷如果p(yk|x)=max{p(y1|x),p(y2|x),…,p(yn|x)},则x∈yk。

计算第⑶步中的各个条件概率的具体方法是:

①找到一个已知分类的待识别项集合作为训练样本集;

②统计得到各类别下各个特征属性的条件概率估计;

p(a1|y1),p(a2|y1),…,p(am|y1);

p(a1|y2),p(a2|y2),…,p(am|y2);

…;

p(a1|yn),p(a2|yn),…,p(am|yn)。

③根据贝叶斯定理,有:

且:

步骤⑼中,训练并建立贝叶斯分类器的方法是:

步骤①、对某个输入特征属性进行分段划分,即进行离散化处理。

步骤②、将步骤⑴中的训练数据样本作为贝叶斯分类器的训练数据样本;计算每类电气负载类型训练数据样本在所有电气负载类型训练数据样本中所占有的比例。

步骤③、计算训练样本每个类型(类别)条件下各个输入特征属性分段的比例(频率),统计得到各类型(类别)下各个输入特征属性的条件概率估计。

以4类负载分类实例来具体说明训练并建立贝叶斯分类器的方法。复合优化决策树分类器的输入特征是{i*,tm,ts,a3,a5,a7},令贝叶斯分类器的特征属性组合x={a1,a2,a3,a4,a5,a6}中的元素与复合优化决策树分类器的输入特征集合中的元素按序{ts,i*,tm,a1,a3,iw}一一对应;贝叶斯分类器的输出类别集合c={y1,y2,y3,y4}则分别与无启动冲击电阻类负载、启动冲击性电阻类负载、异步电机类负载、整流滤波类负载一一对应。

步骤①中,采取的输入特征属性离散化方法是:

a1:{a1<4,4≤a1≤7,a1>7};

a2:{a2<0.035,a2≥0.35};

a3:{a3<0.3,0.3≤a3≤1,a3>1};

a4:{a4<3,3≤a4≤10,a4>10};

a5:{a5<1.1,1.1≤a5≤3.9,a5>3.9};

a6:{a6<0.31,0.31≤a6≤2.3,a6>2.3}。

步骤②中,需要分别计算p(y1)、p(y2)、p(y3)、p(y4)。当每类电气负载均采集相同的样本数量时,例如,对4类负载分别获取500组输入特征样本,其中每类电气负载类型随机选择100组样本作为训练数据样本,其他则作为测试数据样本,总的训练数据样本为400组,则有

p(y1)=p(y2)=p(y3)=p(y4)=0.25。

步骤③中,计算训练样本每个类型(类别)条件下各个输入特征属性分段的比例(频率),统计得到各类型(类别)下各个输入特征属性的条件概率估计,即分别统计计算

p(a1<4|y1)、p(4≤a1≤7|y1)、p(a1>7|y1);

p(a1<4|y2)、p(4≤a1≤7|y2)、p(a1>7|y2);

p(a1<4|y3)、p(4≤a1≤7|y3)、p(a1>7|y3);

p(a1<4|y4)、p(4≤a1≤7|y4)、p(a1>7|y4);

p(a2<0.035|y1)、p(a2≥0.035|y1);

p(a2<0.035|y2)、p(a2≥0.035|y2);

p(a2<0.035|y3)、p(a2≥0·035|y3);

p(a2<0.035|y4)、p(a2≥0.035|y4)。

p(a3<0.3|y1)、p(0.3≤a3≤1|y1)、p(a3>1|y1);

p(a3<0.3|y2)、p(0.3≤a3≤1|y2)、p(a3>1|y2);

p(a3<0.3|y3)、p(0.3≤a3≤1|y3)、p(a3>1|y3);

p(a3<0.3|y4)、p(0.3≤a3≤1|y4)、p(a3>1|y4);

p(a4<3|y1)、p(3≤a4≤10|y1、p(a4>10|y1);

p(a4<3|y2)、p(3≤a4≤10|y2)、p(a4>10|y2);

p(a4<3|y3)、p(3≤a4≤10|y3)、p(a4>10|y3);

p(a4<3|y4)、p(3≤a4≤10|y4)、p(a4>10|y4);

p(a5<1.1|y1)、p(1.1≤a5≤3.9|y1)、p(a5>3.9|y1);

p(a5<1.1|y2)、p(1.1≤a5≤3.9|y2)、p(a5>3.9|y2);

p(a5<1.1|y3)、p(1.1≤a5≤3.9|y3)、p(a5>3.9|y3);

p(a5<1.1|y4)、p(1.1≤a5≤3.9|y4)、p(a5>3.9|y4);

p(a6<0.31|y1)、p(0.31≤a6≤2.3|y1)、p(a6>2.3|y1);

p(a6<0.31|y2)、p(0.31≤a6≤2.3|y2)、p(a6>2.3|y2);

p(a6<0.31|y3)、p(0.31≤a6≤2.3|y3)、p(a6<2.3|y3);

p(a6<0.31|y4)、p(0.31≤a6≤2.3|y4)、p(a6>2.3|y4)。

经过上述的步骤①、步骤②、步骤③,贝叶斯分类器训练完成。其中,步骤①对输入特征属性进行分段划分由人工确定,对每一个输入特征进行分段离散化时,分段的数量为2段或者2段以上,例如,特征a2分为2段,其余特征都分为3段。每一个特征具体分为多少段,分段阈值的选择可以根据训练后的贝叶斯分类器对测试数据样本测试后的结果进行调整。当待识别的电气负载类型增多时,可以增加分段的数量,提高贝叶斯分类器的分类精度。步骤①对输入特征属性的分段,与复合优化决策树分类器步骤⑵中将区间化输入特征的区间分段化不同,步骤①的分段考虑了输入特征的所有取值区间,避免了因为训练数据样本覆盖不全,造成部分输入特征均落入相应的区间化输入特征的有效区间之外,而另外的输入特征均落入相应的区间化输入特征重叠区域,仅靠将区间化输入特征的区间分段化无法完全实现决策分类的情况。步骤②、步骤③由信息处理模块102或者是计算机计算完成。

步骤⑾中,将步骤⑴获取的电气负载样本输入特征中的测试数据样本依次输入至复合优化决策树分类器,是指将多组测试数据样本分组依次输入至复合优化决策树分类器。例如,4类负载分类实例中有400组测试数据样本,将400组测试数据样本,分400次,依次输入至复合优化决策树分类器。统计该节点采用某种方法的总电气负载识别准确率,是指在多组测试数据样本中,该节点采用该方法时,复合优化决策树分类器能够正确识别出电气负载类型的测试数据样本数与总测试数据样本数的百分比值;例如,在400组测试数据样本中,该节点采用某种方法时,复合优化决策树分类器能够正确识别出电气负载类型的测试数据样本是370个,则该节点采用该方法时的总电气负载识别准确率为92.5%。

步骤⑾中,节点使用贝叶斯分类器分类的方法是:

步骤㈠、将复合优化决策树分类器的输入特征作为贝叶斯分类器的输入特征。

步骤㈡、按照式

计算每种电气负载类别的后验概率,其中

步骤㈢、针对该节点所有待识别电气负载类型,选择其中后验概率最大的电气负载类型输出。

以4类负载分类实例进行说明。

步骤㈠中,将复合优化决策树分类器的输入特征集合{i*,tm,ts,a3,a5,a7}作为贝叶斯分类器的输入特征x,且有x={a1,a2,a3,a4,a5,a6}。

步骤㈡中,因为每类电气负载类型的训练数据样本数量均为100组,分母p(x)对于所有电气负载类别为相等常数,令p(x)=1替代实际的p(x)值,不影响每种电气负载类别后验概率之间的相互大小比较,此时有

即有

步骤㈡中,计算每种电气负载类别的后验概率,可以是计算所有电气负载类别的后验概率,例如,4类负载分类实例中,计算所有4类电气负载类别的后验概率;也可以是只计算该节点所有待识别的电气负载类型的后验概率,例如,该节点是启动冲击性电阻类负载与异步电机类负载在6个区间化输入特征均存在重叠区域时无法区分该两类负载的节点,只计算该节点启动冲击性电阻类负载与异步电机类负载的后验概率。

步骤㈢中,针对该节点所有待识别电气负载类型,选择其中后验概率最大的电气负载类型输出。例如,对启动冲击性电阻类负载与异步电机类负载在6个区间化输入特征均存在重叠区域时无法区分该两类负载的节点,选择启动冲击性电阻类负载与异步电机类负载中后验概率最大的电气负载类型输出。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1