本发明属于电网设备监控领域,特别涉及一种用于电网设备监控的语音识别混合模型构建方法和系统。
背景技术:
1、随着新型电力系统建设的推进,电网规模不断扩大,信息化建设不断优化,指挥信息量日益增多。监控值班人员每天要进行庞大的指令发送和接受工作。电力监控语音识别是监控中的关键技术,是对实际现场的信息正确理解的基础。声学模型、发音字典、语言模型以及解码器构成了整个语音识别系统。
2、随着近年来科学技术的快速发展,语音识别也得到了迅速的发展,尤其近年来深度学习的深化应用,发展速度尤为明显。然而电力领域的语音识别技术尚在发展中。现有语音识别技术大部分都是基于通用识别模型、或者专业模型,只有少数模型会结合通用识别模型与电网设备监控专业模型,并未使用百万级参数的通用识别模型。由于电网设备监控专业模型包含电网专业名称以及厂站、线路等设备名称,经常需要更新保障识别准确率,在通用识别模型上对监控专业模型进行微调训练,需要大量的计算资源,对于设备要求过高,硬件成本高,且每次训练时间长。
技术实现思路
1、为了解决现有技术中存在的不足,本发明提供了一种用于电网设备监控的语音识别混合模型构建方法和系统,以解决节省语音识别模型更新时间长、占用资源大以及设备要求高的技术问题。
2、为解决上述技术问题,本发明采用如下的技术方案。
3、本发明首先公开了一种用于电网设备监控的语音识别混合模型构建方法,该方法包括以下步骤:
4、收集电网设备相关文档信息并进行文本预处理,形成电网设备监控领域语料集;
5、将所述电网设备监控领域语料集填充到指令格式模板中,形成监控专业语音识别语料,利用语料增量训练工具将所述监控专业语音识别语料加载到模型训练算法中,对电网设备监控专业模型和热词模型分别进行增量训练;
6、将训练后的所述电网设备监控专业模型导出为专业声学模型和专业语言模型,将通用识别模型导出为通用声学模型和通用语言模型,将待识别语音信号片段分别输入所述专业声学模型和专业语言模型,以及通用声学模型和通用语言模型,基于wfst的viterbi解码算法计算两种模型的词序列得分差值,对于得分差值高于预设阈值的音素片段,以最高得分对应的模型进行解码输出,对于得分差值不高于预设阈值的音素片段,基于所述热词模型判断所述音素片段是否包含电网专业词,如果包含,则以所述电网设备监控专业模型进行解码输出,如果不包含,则以所述通用识别模型进行解码输出。
7、本发明进一步包括以下优选方案:
8、所述收集电网设备相关文档信息并进行文本预处理,形成电网设备监控领域语料集,进一步包括:
9、读取电网设备模型、运行实时库以及历史库,整理电网设备模型词典,包括本年度最新的规章制度、规程规范、作业指导书、办公文档、电网词典、设备模型、交互指令,并对电网设备模型中的特殊符号进行名词转换;
10、通过自然语言处理算法进行分段、分句处理,根据电网设备模型词典对处理后的语句进行分词分析,解析语句中的设备参数、监控词汇,构建监控专业词典。
11、所述语料增量训练工具包括:
12、监控词库拓展工具,用于对电网监控词库进行拓展,通过导入文件、界面新增,获取所有需要拓展的词汇,新增新词汇,保持原有词汇,更新电网监控词库,丰富拓展电网监控词汇;
13、模型加载工具,用于对不同模型进行加载,加载旧模型用于新模型的增量训练,解析模型中意图、语料和实体间的关系;
14、语料加载工具,用于在模型训练时加载语料,将文本文件形式的语料提取出来,并根据模型训练的格式要求生成不同的json格式内容,加载到模型训练算法中,为模型训练提供数据;
15、模型校正工具,用于采用模型校正算法对于相近语料提供多种不同的语料多次进行训练,训练预设次数后得到新的识别准确率,满足要求后得到最终训练模型;
16、语料训练工具,用于采用模型校正算法以及语料训练算法优化语料训练过程,对语料进行筛选,提取关键部分;
17、模型生成工具,用于将已经训练完成的模型文件导出。
18、所述加载语料,进一步包括:
19、根据电网设备模型词典与监控专业词典,结合指令格式进行语料拼接,根据指令格式简化各个模板,模板中使用词典名称替换指令中具体的值,读取电网设备模型词典与监控专业词典填充到指令格式模板中,完成监控专业语音识别语料自动生成,然后将生成的语料保存到数据库中,并生成json格式或者txt格式的语料文件。
20、对于json格式的语料文件,所述语料文件包括语料文本内容text及其实体entities和意图intent,其中每个实体都包含实体起始位置start、实体结束位置end、实体内容value、实体名称entity。
21、本发明同时公开了一种利用前述用于电网设备监控的语音识别混合模型构建方法的用于电网设备监控的语音识别混合模型构建系统,包括:
22、语料收集模块,用于收集电网设备相关文档信息并进行文本预处理,形成电网设备监控领域语料集;
23、模型训练模块,用于将所述电网设备监控领域语料集填充到指令格式模板中,形成监控专业语音识别语料,利用语料增量训练工具将所述监控专业语音识别语料加载到模型训练算法中,对电网设备监控专业模型和热词模型分别进行增量训练;
24、语音识别模块,用于将训练后的所述电网设备监控专业模型导出为专业声学模型和专业语言模型,将通用识别模型导出为通用声学模型和通用语言模型,将待识别语音信号片段分别输入所述专业声学模型和专业语言模型,以及通用声学模型和通用语言模型,基于wfst的viterbi解码算法计算两种模型的词序列得分差值,对于得分差值高于预设阈值的音素片段,以最高得分对应的模型进行解码输出,对于得分差值不高于预设阈值的音素片段,基于所述热词模型判断所述音素片段是否包含电网专业词,如果包含,则以所述电网设备监控专业模型进行解码输出,如果不包含,则以所述通用识别模型进行解码输出。
25、相应地,本申请还公开了一种终端,包括处理器及存储介质;
26、所述存储介质用于存储指令;
27、所述处理器用于根据所述指令进行操作以执行根据前述用于电网设备监控的语音识别混合模型构建方法的步骤。
28、相应地,本申请还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述用于电网设备监控的语音识别混合模型构建方法的步骤。
29、本发明的有益效果在于,与现有技术相比,本发明提供了一种用于电网设备监控的语音识别混合模型构建方法和系统,降低了模型训练成本,在现有服务器上即可完成模型训练;减少了模型训练时间,每次训练不涉及通用语言模型部分,在原先监控专业模型上进行增量训练,便捷快速。在社会经济效益上,提高了监控专业词汇识别准确率和日常通用词汇识别准确率。
1.一种用于电网设备监控的语音识别混合模型构建方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的用于电网设备监控的语音识别混合模型构建方法,其特征在于,所述收集电网设备相关文档信息并进行文本预处理,形成电网设备监控领域语料集,进一步包括:
3.根据权利要求2所述的用于电网设备监控的语音识别混合模型构建方法,其特征在于,所述语料增量训练工具包括:
4.根据权利要求3所述的用于电网设备监控的语音识别混合模型构建方法,其特征在于,所述加载语料,进一步包括:
5.根据权利要求4所述的用于电网设备监控的语音识别混合模型构建方法,其特征在于,对于json格式的语料文件,所述语料文件包括语料文本内容text及其实体entities和意图intent,其中每个实体都包含实体起始位置start、实体结束位置end、实体内容value、实体名称entity。
6.一种用于电网设备监控的语音识别混合模型构建系统,其特征在于,包括:
7.根据权利要求6所述的用于电网设备监控的语音识别混合模型构建系统,其特征在于,所述语料收集模块,进一步用于:
8.根据权利要求7所述的用于电网设备监控的语音识别混合模型构建系统,其特征在于,所述语料增量训练工具包括:
9.根据权利要求8所述的用于电网设备监控的语音识别混合模型构建系统,其特征在于,所述语料加载工具,进一步用于:
10.根据权利要求9所述的用于电网设备监控的语音识别混合模型构建系统,其特征在于,对于json格式的语料文件,所述语料文件包括语料文本内容text及其实体entities和意图intent,其中每个实体都包含实体起始位置start、实体结束位置end、实体内容value、实体名称entity。
11.一种终端,包括处理器及存储介质;其特征在于:
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-5任一项所述的用于电网设备监控的语音识别混合模型构建方法的步骤。