本发明属于语音识别,具体涉及一种基于语义分析的语音转写文本纠错方法及系统。
背景技术:
1、语音识别的研究工作可以追溯到20世纪50年代at&t贝尔实验室的audry系统,它是第一个可以识别十个英文数字的语音识别系统。但真正取得实质性进展,并将其作为一个重要的课题开展研究则是在60年代末70年代初。
2、在语音识别应用中逐渐形成电力智能语音输入法系统。通过研究深度学习技术、基于深度全序列卷积神经网络语音识别技术、语音预处理技术和自然语言处理关键技术,与大数据支撑的云平台结合,研发出国网专属的语音输入法。
3、但是,在语音转写文本的过程中由于输变配用领域缺少专属的电力语音词汇学习,使用智能语音输入法时容易出现语音转写文本错误的情况,但是目前缺乏对语音转写文本纠错的方法,导致机器无法像人类一样去发现问题、思考问题和解决问题,对语音交互技术应用到持消费者的交互习惯时产生不良影响。
技术实现思路
1、有鉴于此,本发明提供了一种基于语义分析的语音转写文本纠错方法及系统,综合应用语义检索、理解、分析以及云计算技术,实现电力业务场景的语音转写文本的纠错;基于语义理解分析模型、语义检索模型以及云计算技术,对巡检、经营管理等场景下的语音进行充分理解,完成残缺意图关键语义抽取、语义理解和语义摘要,实现电力业务场景的下的语音转写文本的正确识别。
2、本发明至少一个方案提供了一种基于语义分析的语音转写文本纠错方法,应用于语音输入平台,所述该方法包括:
3、获取语音输入平台对语音采集数据识别处理的语音转写文本;
4、将所述语音转写文本输入至文本纠错模型,输出得到待纠错单词;
5、对所述语音转写文本进行语义解析,对待纠错单词进行语义分析,得到预测的纠正词,将纠正词替换待纠错单词,得到纠错后文本。
6、作为本发明的进一步方案,所述获取语音输入平台对语音采集数据识别处理的语音转写文本,包括:
7、接收语音响应终端采集的语音输入指令,其中,所述语音输入指令包括输入请求标识信息;
8、根据所述语音输入指令触发所述语音输入平台获取语音响应终端采集的语音数据;
9、对获取的所述语音数据去噪及进行音频预处理后,输入预训练的语音识别模型进行识别处理,通过所述语音识别模型识别处理得到语音转写文本。
10、作为本发明的进一步方案,所述语音识别模型基于构建的包含电力专网专业词库的语料库训练,其中,语音识别模型进行识别处理时,包括对输入的语音数据进行特征提取以及语音匹配。
11、作为本发明的进一步方案,所述特征提取为从输入的原始语音信号中抽取出语音特征参数,所述语音特征参数包括时域参数和频域参数。
12、作为本发明的进一步方案,所述文本纠错模型为电力业务场景的历史纠错文本训练得到,文本纠错模型的训练方法包括:
13、获取电力业务场景的历史待纠错文本,将历史待纠错文本作为样本数据,其中,所述样本数据中包含历史待纠错文本的待纠错单词;
14、将所述样本数据划分为训练数据集和测试数据集,利用所述训练数据集输入至构建的初始模型中训练;
15、采用所述测试数据集对所述初始模型进行测试,并重新划分所述训练数据集和测试数据集进行训练及模型调优,得到文本纠错模型。
16、作为本发明的进一步方案,对所述语音转写文本进行语义解析,对待纠错单词进行语义分析,得到预测的纠正词,包括:
17、对所述语音转写文本进行分段处理后得到多个预设长度目标文本片段;
18、基于拼音指南为所述目标文本片段生成文本片段拼音;
19、在电力业务场景的领域知识库进行目标文本片段以及文本片段拼音的检索,检索得到文本领域词条,所述文本领域词条包括专有纠正词和音近纠正词;
20、将文本领域词条进行语义分析获得文本相似片段,根据所述文本相似片段对所述语音转写文本进行调整并对比,生成语音转写文本的文本领域词条相似度,直至所得到的文本相似度满足相似度阈值,得到预测的纠正词。
21、作为本发明的进一步方案,对语音转写文本进行分段处理后得到多个预设长度目标文本片段时,还包括:
22、对语音转写文本和所述目标文本片段进行文本对齐和分词处理,得到语音转写文本的文本分词序列和目标文本片段的片段分词序列,基于文本分词序列和片段分词序列确定预选纠错词;
23、在电力业务场景的领域知识库进行目标文本片段以及文本片段拼音的检索,检索得到所述预选纠错对应的文本领域词条。
24、作为本发明的进一步方案,将纠正词替换待纠错单词,得到纠错后文本,包括:
25、将语音转写文本中的待纠错单词进行掩码处理,将待纠错单词替换为随机字符;
26、根据预测得到的待纠错单词对应的纠正词,将随机字符进行替换,生成纠错后文本。
27、本发明又一个方案,还提供了一种基于语义分析的语音转写文本纠错系统,用于执行上述基于语义分析的语音转写文本纠错方法,所述基于语义分析的语音转写文本纠错系统包括:
28、文本获取模块,用于获取语音输入平台对语音采集数据识别处理的语音转写文本;
29、模型纠错模块,用于将所述语音转写文本输入至文本纠错模型,输出得到待纠错单词;
30、纠正替换模块,用于对所述语音转写文本进行语义解析,对待纠错单词进行语义分析,得到预测的纠正词,将纠正词替换待纠错单词,得到纠错后文本。
31、作为本发明的进一步方案,还包括词条检索模块,用于对语音转写文本和所述目标文本片段进行文本对齐和分词处理,得到语音转写文本的文本分词序列和目标文本片段的片段分词序列,基于文本分词序列和片段分词序列确定预选纠错词;在电力业务场景的领域知识库进行目标文本片段以及文本片段拼音的检索,检索得到所述预选纠错对应的文本领域词条。
32、本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现基于语义分析的语音转写文本纠错方法的步骤。
33、本发明还包括一种存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现基于语义分析的语音转写文本纠错方法的步骤。
34、本发明提供的技术方案,具有如下有益效果:
35、本发明提供的基于语义分析的语音转写文本纠错方法及系统,通过获取语音输入平台对语音采集数据识别处理的语音转写文本;将所述语音转写文本输入至文本纠错模型,输出得到待纠错单词;对所述语音转写文本进行语义解析,对待纠错单词进行语义分析,得到预测的纠正词,将纠正词替换待纠错单词,得到纠错后文本。通过文本纠错模型对语音转写文本进行识别,得到待纠错单词,经语义解析后通过正词替换待纠错单词得到纠错后文本。在语音识别后可以快速纠错文本,提高了对语音识别文本纠错的效率和准确度,配合语音输入法在电力专网中的应用,提高了语音输入平台在针对坐席和客户交互时电力专网语音数据的处理效率和准确率。