本发明涉及电力调度,尤其涉及基于k-mean++和bilstm的电力调度语音信息挖掘方法。
背景技术:
1、在调度语音大数据的背景下,地区电网生产管理系统拥有大量的调度语音记录,但是缺少系统化的利用和整理。语音识别是解决该问题的有效手段之一,也是推进电网智能化建设的重要举措。
2、有资料显示,目前在电力系统的电话调度过程中,均需要对调度过程进行电话录音,但现有的调度录音系统仅能完成语音记录功能,以语音格式存放与现有的录音系统中,电力调度事故的处理、事故的回溯仅依靠人工遍听历史音频信息,无法实现针对个人以及电力调度事故联系信息抽取和集中,亦无法完成对信息的统计和分析,这一重要数据目前无法发挥促进生产运行规范性、安全性持续提高的价值。
3、中国专利文献cn107671414a公开了一种“基于调度电话识别的电力调度事故回溯方法”。包括:采集某一区域中的电力调度事故信息以及调度员语音信息,并建立基于电力调度事故的第一dikw模型以及基于调度员语音信息的第二dikw模型;基于第一dikw模型和第二dikw模型进行内容和逻辑的匹配分析,获得与特定电力调度事故对应的特定调度员语音信息;对特定调度员语音信息进行语义识别,基于语义识别结果展示特定电力调度事故的事件链条;对第一dikw模型和第二dikw模型进行内容和逻辑的匹配分析,获得与特定电力调度事故对应的特定调度员语音信息,从而帮助分析人员能快速建立调度员录音与电力调度事故的拓扑关系,方便分析人员快速分析电力调度事故。上述技术方案难以实现电力调度优先级的精确分类,无法优先处理紧急的故障。
技术实现思路
1、本发明主要解决原有的技术方案难以实现电力调度优先级的精确分类,无法优先处理紧急的故障的技术问题,提供基于k-mean++和bilstm的电力调度语音信息挖掘方法,通过基于k-mean++和bilstm的电力调度语音信息挖掘,能够实现电力设备故障程度的自动精准高效分类,通过紧急程度优先推送调度员处理更为紧急的故障,以此提升电网的智能化管理水平。
2、本发明的上述技术问题主要是通过下述技术方案得以解决的:本发明包括以下步骤:
3、s1将单个话语转换为多个片段;
4、s2使用k-mean++算法对总段进行聚类;
5、s3利用stft算法将每个片段转换成频谱图;
6、s4将谱图序列馈送到cnn模型中;
7、s5将cnn输出量输入到bilstm模型中挖掘故障信息,输出预测结果;
8、s6根据输出的预测结果,判定故障紧急程度级别。
9、通过基于k-mean++和bilstm的电力调度语音信息挖掘,能够实现电力设备故障程度的自动精准高效分类,通过紧急程度优先推送调度员处理更为紧急的故障,以此提升电网的智能化管理水平。
10、作为优选,所述的步骤s1具体包括:
11、s1.1以500ms的窗口大小来将单个话语转换为多个片段;
12、s1.2对一个话语的所有片段分配单个标签。
13、作为优选,所述的步骤s2具体包括:
14、s2.1从数据集x中随机选取一个数据样本x(x={x1,x2,…,xn})作为第一个初始聚类中心;
15、s2.2计算每个数据样本x'={x1',x'2,…,x'n}与当前聚类中心之间的最短距离d(x);
16、s2.3计算每个数据样本被选为下一个聚类中心的概率p(x);
17、
18、
19、式中,d(x)为数据之间的欧氏距离运算;
20、s2.4选择最大概率对应的数据样本作为下一个聚类中心;
21、s2.5重复步骤2-2到2-4至k个聚类中心选择完成;
22、s2.6对各个样本计算其与聚类中心之间的欧式距离;
23、s2.7将各个样本,根据欧氏距离最小的原则,对应到聚类中心;
24、s2.8从每个聚类中选取一个靠近聚类质心的键段作为关键段,该键段代表整个聚类。
25、作为优选,所述的步骤3具体包括:
26、s3.1将窗口移动到信号的开端位置,此时窗函数的中心位置在t=τ0处,对信号加窗处理:
27、y(t)=x(t)·w(t-τ0)
28、s3.2进行傅里叶变换
29、
30、由此得到第一个分段序列的频谱分布x(ω),由于信号是离散的点序列,所以得到的是频谱序列x[n];
31、s3.3完成了对第一个分段的傅里叶变换操作后,移动窗函数到τ1;
32、s3.4重复以上操作,不断滑动窗口、进行傅里叶变换,最终得到从τ0~τn上所有分段的频谱结果。把窗体移动的距离称为hop size。移动距离一般小于窗口的宽度,从而保证前后两个窗口之间存在一定重叠部分,这个重叠叫overlap。
33、作为优选,所述的步骤s3.2定义函数s(ω,τ),表示在窗函数中心为τ时,对原函数进行变换后的频谱结果,即:
34、
35、对应到离散场景中,s(ω,τ)就是一个二维矩阵,每一列代表了在不同位置对信号加窗,对得到的分段进行傅里叶变换后的结果序列。
36、作为优选,所述的步骤s4中cnn层包括依序连接的第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层和输出层。
37、步骤4-1:所述第一卷积层使用7×7×64的卷积核进行卷积和3×3的最大池化网络实现池化,池化网络可以有效的缩小参数矩阵的尺寸,从而减少最后连接层的中的参数数量。第一卷积层的输出输入到第二卷积层。
38、步骤4-2:所述第二卷积层使用3个1×1×64的卷积核、3×3×64的卷积核和1×1×256的卷积核进行卷积。第二卷积层的输出输入到第三卷积层。
39、步骤4-3:所述第三卷积层使用4个1×1×128的卷积核、3×3×128的卷积核和1×1×512的卷积核进行卷积。第三卷积层的输出输入到第四卷积层。
40、步骤4-4:所述第四卷积层使用6个1×1×256的卷积核、3×3×256的卷积核和1×1×1024的卷积核进行卷积。第四卷积层的输出输入到第五卷积层。
41、步骤4-5:所述第五卷积层使用3个1×1×512的卷积核、3×3×512的卷积核和1×1×2048的卷积核进行卷积。
42、步骤4-6:第五卷积层的输出经过平均池化、1000个神经元的全连接层和softmax激活函数计算后,得到输出层的输出结果。
43、作为优选,所述的步骤s5具体包括:使用两个循环神经网络组成bilstm模型,进一步提取语音信息。
44、bilstm模型由两个循环神经网络(recurrent neural network,rnn)组成。
45、rnn也叫递归神经网络,依据时间序列进行自我调用的特殊神经网络。循环神经网络每个时间状态的网络拓扑结构相同,在任意t时间下,均包含三层神经网络(输入层、隐藏层、输出层)。
46、正向的循环神经网络参与正向计算,利用过去的信息t时刻的输入为t时刻的序列输出和t-1时刻的输出;逆向的循环神经网络参与反向计算,利用未来的信息t时刻的输入为t时刻的序列输出和t+1时刻的输出。这样在t时刻的最终输出值,既能够使用过去时刻的信息,也能够使用未来时刻的信息。
47、bilstm模型通过3个控制门单元(输入门、遗忘门、输出门)选择保留或者忘记信息。输入门控制当前时刻的输入信息有多少需要保留;遗忘门控制上一时刻的信息需要丢弃多少;输出门控制当前时刻有多少信息需要输出给隐藏状态。
48、作为优选,所述的步骤s6具体包括:将故障的现象分为紧急、重大、一般3类程度。紧急定义为类别0,一般定义为类别1,重大定义为类别2。将步骤s5输出的向量经过全连接层,输出至softmax分类器,得到对应3种类别的概率,选取概率最大的作为最终的类别,完成故障紧急程度分类任务。
49、本发明的有益效果是:通过基于k-mean++和bilstm的电力调度语音信息挖掘,能够实现电力设备故障程度的自动精准高效分类,通过紧急程度优先推送调度员处理更为紧急的故障,以此提升电网的智能化管理水平。