基于贝叶斯-随机森林的生物触电类型辨识方法及装置

文档序号:38027027发布日期:2024-05-17 13:02阅读:7来源:国知局
基于贝叶斯-随机森林的生物触电类型辨识方法及装置

本发明涉及生物触电辨识,尤其涉及一种基于贝叶斯-随机森林的生物触电类型辨识方法及装置。


背景技术:

1、低压供电系统所处环境复杂,随机性、不确定因素较多,难以察觉的绝缘破损可能导致用户在毫无防备的情况下触电。在低压系统中,传统触电保护技术主要是利用剩余电流动作装置实现,通过传感器检测剩余电流的幅值构造保护判据。然而在实际应用场景中,剩余电流幅值变化难以准确反映触电事故的发生,由于正常对地泄漏电流的存在,剩余电流保护器会存在固有的保护死区。有从业者提出通过剩余电流变化率、相位、脉冲波形等信息监测漏电,针对剩余电流保护器死区的问题,再通过剩余电流变化量构造保护判据,但是该类方式仍然无法准确反映触电事故的发生,尤其是无法准确区分普通漏电与生命体触电。

2、将模糊模式识别模型应用到触电检测领域中,通过识别触电对象的类型,可以实现普通漏电与生命体触电的区分,有助于故障研判准确率,减少滋扰跳闸带来的困扰。然而,现有技术中模糊模式识别模型方法容易受到特征值的影响,当特征值在不同类别中处于混叠状态时,该类方法将出现训练收敛困难、泛化能力弱等的问题。


技术实现思路

1、本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种实现方法简单、辨识效率以及精度高、泛化能力强的基于贝叶斯-随机森林的生物触电类型辨识方法及装置。

2、为解决上述技术问题,本发明提出的技术方案为:

3、一种基于贝叶斯-随机森林的生物触电类型辨识方法,步骤包括:

4、获取不同生物类别触电电流数据,分别提取多种时域以及频域特征参数构成训练数据样本集,使用训练数据样本集训练基于随机森林模型构建形成的辨识模型,所述辨识模型为基于随机森林模型由多个互不相同决策树弱评估器构成,并在随机森林模型中使用贝叶斯化方法对随机森林超参数进行寻优确定出最优随机森林超参数组合;

5、对待辨识触电电流数据提取多种时域以及频域特征参数,输入至训练后得到的所述辨识模型中输出多个结果,对各个结果采用投票机制确定出最终结果,得到触电的生物类别辨识结果输出。

6、进一步的,所述在随机森林模型中使用贝叶斯化方法对随机森林超参数进行寻优确定出最优随机森林超参数组合的步骤包括:

7、确定所需优化的超参数,并为每个超参数定义一个取值范围或离散集合,所述超参数包括决策树个数、树的最大深度、树最大特征数、叶子节点最小样本数以及特征节点纯度判据中任意多种;

8、选择一个高斯过程回归模型作为高斯过程模型,并对均值函数和协方差函数的超参数值进行初始化;

9、执行迭代优化,在迭代优化过程中不断根据高斯过程模型使用最大化采样函数选择超参数组合训练随机森林模型,最终得到能够使随机森林模型性能指标最优的超参数组合并作为最优超参数组合输出。

10、进一步的,所述迭代优化的步骤包括:

11、根据当前高斯过程模型使用最大化采样函数选择下一个需要评估的超参数组合;

12、使用当前选定的超参数组合在训练集上训练随机森林模型,并使用验证集评估模型性能;

13、将当前超参数组合和对应在验证集上性能测试结果作为新的数据点加入到高斯过程模型的训练数据中,重新拟合高斯过程模型的参数;

14、根据预设停止准则判断是否继续迭代优化,迭代优化结束后,根据最终的高斯过程模型选择具有最高性能的超参数组合作为最终的模型配置,并选择在验证集上性能评估指标最优所对应的超参数组合作为最优超参数组合。

15、进一步的,所述最大化采样函数的计算表达式为:

16、a(x)=μ(x)+κσ(x)

17、

18、

19、其中a(x)为采样函数值,μ(x)是高斯过程模型对目标函数在x点处的预测均值,σ(x)为高斯过程模型在点x处的预测值,κ为常数,m(x)为均值函数,k(·,·)为协方差函数,σn为噪声参数。

20、进一步的,先由多个互不相同的同决策树弱评估器构成初始随机森林模型,采用bagging方法将训练数据样本集中生成多个子数据集,对各个弱评估器进行并行拟合训练,根据每个评估器分类结果的纯净程度不断优化决策树分类流程和特征阈值,输出完成数据拟合的随机森林模型,得到训练后的辨识模型。

21、进一步的,所述采用bagging方法将训练数据样本集中生成多个子数据集,对各个弱评估器进行并行拟合训练包括:

22、有放回且随机地从训练数据样本集中抽取部分样本形成多个子样本集,得到自助集;

23、按照确定的随机森林超参数组合,生成与自助集数量相等的基于决策树模型的弱评估器,各弱评估器的结构参数互不相同;

24、启动各个弱评估器与自助集之间的并行拟合过程,并将未纳入自助集的样本作为测试集以用于在测试阶段对训练后模型进行测试。

25、进一步的,所述时域以及频域特征参数包括基波、三次谐波、五次谐波、基波比率、三次谐波比率、五次谐波比率、积分、方差、峰度、香农熵中任意多种,其中所述积分通过将各个样本中单个值的累加和计算得到,以用于表征波形的面积,使用所述方差表征波形的浮动程度,使用所述峰度特征表征波形尖峰的陡峭程度,使用所述香农熵表征波形复杂程度。

26、进一步的,

27、其中i为积分,si表示样本中的单个值,n为样本的长度;

28、方差的计算公式为:

29、

30、其中,v为方差,表示样本向量所有值的平均数;

31、峰度特征的计算公式为:

32、

33、其中k为峰度特征;

34、香农熵特征的计算公式为:

35、

36、其中s为香农熵特征。

37、一种基于贝叶斯-随机森林的生物触电类型辨识装置,包括:

38、辨识模型训练模块,用于获取不同生物类别触电电流数据,分别提取多种时域以及频域特征参数构成训练数据样本集,使用训练数据样本集训练基于随机森林模型构建形成的辨识模型,所述辨识模型为基于随机森林模型由多个互不相同决策树弱评估器构成,并在随机森林模型中使用贝叶斯化方法对随机森林超参数进行寻优确定出最优随机森林超参数组合;

39、实时辨识模块,用于对待辨识触电电流数据提取多种时域以及频域特征参数,输入至训练后得到的所述辨识模型中输出多个结果,对各个结果采用投票机制确定出最终结果,得到触电的生物类别辨识结果输出。

40、一种计算机装置,包括处理器以及存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序以执行如上述方法。

41、一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现如上述方法。

42、与现有技术相比,本发明的优点在于:本发明通过基于随机森林模型构建辨识模型,同时通过贝叶斯优化算法对随机森林模型超参数进行寻优输出局部最优超参数组合,结合对随机森林模型进行并行数据拟合,实现对模型中每个弱分类器的独立、并行训练,利用随机森林固有的集成辨识机制,实现贝叶斯-随机森林的低压生物触电辨识,能够有效规避特征混叠在触电辨识的干扰,在确保辨识效率的同时,提高辨识的精度以及泛化能力。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1