一种电力系统调度控制语音识别模型建立方法与流程

文档序号：34389901发布日期：2023-06-08 09:26阅读：54来源：国知局

本发明属于电力系统调度控制领域，具体涉及一种电力系统调度控制语音识别模型建立方法。

背景技术：

1、近年来，在我国各行各业电力需求不断增加，煤电、水电等传统发电装机容量上升迅速，与此同时，风力发电、光伏发电等新能源技术接入电网的比例也大幅度上升，对电力系统调度运行带来了更严峻的考验，调度人员的工作量大幅提升，导致了各种运行故障时有发生。这说明了，随着各级电网调度数据接入规模的快速增大，调度员承担的职责和复杂性日益增多，给电网调度指令的正确下发和电网的安全稳定运行带来了严峻的挑战。

2、本发明利用大量的调度语音数据进行机器深度学习，充分挖掘调度中心数据的价值，在现有电力调度系统中建立起一套基于调度语音大数据和深度学习的语音识别系统，能够提升调度可靠性，从而减少因调度误操作引发的区域性故障等问题。

3、调度语音识别是解决该问题的有效手段之一，也是推进电网智能化建设的重要举措，引入电网调度语音识别，并结合电网专业知识背景构建了电网调度语音声学词表，建立了电网调度语音识别声学模型，在特征计算时采用了倒谱均值方差归一化方法，以降低信道和噪声影响，提升声学模型的鲁棒性，该模型可以有效提升调度语音识别的准确性。

4、语音识别是控制中心将声音信号转化为二进制数据用于存储、读取、辨识的步骤，随着电力系统的发展与科技水平的增长，在电力调度系统中也需要将庞大的调度语音数据进行处理、识别。语音识别也被广泛地应用于电网调度管理平台、变电站机器人智能巡检线路智能巡检等场景中，不仅体现了电网“大云物移智链”的前沿发展方向，也将极大地提升电网运维的便捷性和可靠性。

技术实现思路

1、本发明的目的在于提供一种电力系统调度控制语音识别模型建立方法，以解决上述背景技术中提出的问题。

2、为实现上述目的，本发明提供如下技术方案：一种电力系统调度控制语音识别模型建立方法，包括模型建立階段和指令控制階段，模型建立階段包含以下步骤，

3、s1：通过电力系统语音识别采集器大量采集调度原始语音数据；

4、s2：提取声学特征；

5、s3：经解码后训练声学模型；

6、s4：将训练后的声学模型与声学词表、训练后的语音模型构成模型网络；

7、s5：不断采集更多调度原始语音数据，重复以上s1到s4步骤，进行多次反复训练；

8、指令控制階段包含以下步骤，

9、s1：提取输入语音特征；

10、s2：建立声学模型表示；

11、s3：经解码后训练声学模型；

12、s4：词表匹配，形成语句文本；

13、s5：建立具有电力调度权限的人员的音频信号特征数据库；

14、s6：电力调度身份数据核对；

15、s7：对符合身份调度权限的形成并完成控制指令；

16、s8：对不符合身份调度权限的进行取消指令，结束。

17、一种电力系统调度控制语音识别模型建立方法，其特征在于，包括建立语音识别模型，的语音识别模型的建立包含以下处理过程：声音处理、声学特征提取、声学特征解码、语言模型、词表匹配、语言解码。

18、声学模型和语言模型的建立是提升语音识别准确率的关键。首先通过大量的调度原始语音数据进行声音处理，提取出声学特征，经解码后训练声学模型；其次将训练后的声学模型与声学词表、训练后的语音模型构成模型网络，此时模型训练完毕；接着输入语音，提取语音特征，由声学模型表示；最后经解码器搜索解码，输出识别结果。

19、声学模型描述了声学基本单元产生特征序列的变换过程，即根据声学模型，计算一个声学特征矢量属于每个声学基本单元的概率，依据最大似然准则判断出状态序列。语音识别系统中常用的声学模型有三种，包括:动态时间规整、矢量量化、隐马尔可夫模型，其中应用最为广泛的是隐马尔科夫模型建模。一个任意的分布可以在任意的精度下用多个高斯混合的加权平均来逼近。深度学习算法被研究者们尝试应用在语音识别领域，语音识别训练能容纳的数据量和识别效果均大大增强，例如微软将深度学习网络和hmm结合，并采用深度信念网进行dnn的预训练过程，在数据量大的语音识别系统中表现较为优异。语言模型旨在描述一种语言的单词排列结构，也就是告诉机器有哪些合法的单词组合，分为规则语言模型和统计语言模型两类。统计语言模型是经大量文本数据训练的、统计词语和词语组合的条件概率的模型。

20、优选的，声学词表为电网调度语音声学词表，电网调度语音声学词表以通用词表为基础，引用大量电网调度指令的语音库和语料库，电网调度语音声学词表包含两类词汇：一类是电网台账信息中常见的命名实体，例如变电站名、线路名、变压器名等；另一类是电网调度命令常用的动词。

21、电网调度语言包含一些符合电力规范的专业用语，通常以单句的形式出现，电网调度语言中的命名实体，如果采用通用的声学词表，而不引入电网语料背景，容易出现分词错误，例如“赤湖变”在通用词表中就不是一个词，它实际上是电力专业用语中采用地名+“变”的变电站命名方式，像这样的关键字还有“站”“所”“线”等。并且，“赤湖”也是专用地点名词，如果不加入声学词表中也容易出现分词错误。此外，一些仅在电力行业使用的高频词汇也应当加入声学词表中，例如“冷备用”“热备用”“分闸”“合闸”“合上”等。在电力调度系统的文本词库中，这些名词出现的频率很低，系统无法判断出是否为调度相关，在实际应用时很难确定获得文本命名实体的识别正确性。因此，系统需要构建以电力系统调度语言的文本特征，帮助调度系统对出现的模糊名词做出准确判断。以通用词表为基础，引入大量电网调度指令的语音库和语料库，主要包含两类词汇：一类是电网台账信息中常见的命名实体，例如变电站名、线路名、变压器名等；另一类是电网调度命令常用的动词。同时，依据语音库和语料库，对通用词表进行相关性分析，剔除大量的低频甚至零频率词汇，提高模型检索效率和识别准确率。

22、优选的，学词表用于在声学模型、语言模型完成训练后共同构成模型网络，当待识别语音输入后，由声学模型进行分析、解码、识别，并在声学词表中检索匹配的文字输出。因此，声学词表的完备性、集中性在很大程度上影响着检索效率和匹配精度。

23、优选的，声音处理是对原始声音信号数据进行压缩的过程，或者是对信号解卷积的过程。

24、优选的，声学特征提取是从处理后的声音数据中提取高辨识度的声学特征，训练的深度学习模型表现才能突出，这些提取出的声学特征是多维向量，并且其取值离散或者连续。

25、优选的，语言模型旨在描述一种语言的单词排列结构，也就是告诉机器有哪些合法的单词组合，分为规则语言模型和统计语言模型两类。统计语言模型是经大量文本数据训练的、统计词语和词语组合的条件概率的模型，其中n－gram具有设计简单、准确率良好的优点，被广泛应用于语音识别领域。

26、优选的，声学特征解码的作用是给定一个语音特征序列，通过语言模型、声学词表、声学模型组成的模型网络搜索得分较高的状态序列，不同状态序列得分取决于不同的声学模型得分和语言模型得分。

27、与现有技术相比，本发明的有益效果是：

28、本发明一种电力系统调度控制语音识别模型建立方法不仅体现了电网“大云物移智链”的前沿发展方向，也将极大地提升电网运维的便捷性和可靠性。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈嘉王龙杨旸吴谦高强吕为翁俊鸿张伟贤曹易曾旭林朝哲陈建民
技术所有人：深圳供电局有限公司
我是此专利的发明人

上一篇：一种制氢与合成氨耦合的装置系统及方法与流程
上一篇：一种基于无人机的冬小麦生物量快速高精准估测方法