本发明实施例涉及语音识别,尤其涉及一种语音识别方法、装置、电子设备及存储介质。
背景技术:
1、由于端到端语音识别技术可以取得比传统混合式语音识别技术更好的语音识别效果,所以,端到端语音识别技术广泛应用于语音识别领域中。
2、目前,端到端语音识别技术通常通过以下方式实现,在接收到语音信号时,开始对所接收到的语音信号进行语音识别,在语音信号接收结束时,得到该语音信号的初始语音识别结果,对初始语音识别结果进行重打分处理后,以得到该语音信号的最终语音识别结果。
3、但上述方法,在得到最终语音识别结果时,需要在得到初始语音识别结果的基础上所得到,若所接收到一段长语音信号时,会使得所得到的最终语音识别结果出现延迟的情况,从而影响到用户的使用体验。
技术实现思路
1、鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供一种语音识别方法、装置、电子设备及存储介质。
2、第一方面,本发明实施例提供一种语音识别方法,包括:
3、在目标对象开始说话时,接收所述目标对象所在终端发送的目标语音信号;
4、在所述目标语音信号每满足第一预设条件时,对所述目标语音信号进行重打分处理,以得到所述目标语音信号对应的语音识别结果;其中,所述第一预设条件包括:所述目标语音信号对应的实际字数达到预设字数;
5、在确定所述目标对象说话结束时,获取到多个所述目标语音信号对应的语音识别结果;
6、根据多个所述目标语音信号对应的语音识别结果,确定所述目标对象从开始说话至说话结束的过程所对应的目标语音识别结果。
7、在一个可选的实施方式中,所述方法,还包括:
8、在所述目标对象开始说话至说话结束的过程中,按照预设顺序关系,依次将所得到的各个所述目标语音信号对应的语音识别结果进行排序后存储,所述预设顺序关系用于表征语音识别结果对应的识别时间由小至大的顺序;
9、所述根据多个所述目标语音信号对应的语音识别结果,确定所述目标对象从开始说话至说话结束的过程所对应的目标语音识别结果,包括:
10、按照所述预设顺序关系,将多个所述目标语音信号对应的语音识别结果进行串接处理,以得到所述目标对象从开始说话至说话结束的过程所对应的目标语音识别结果。
11、在一个可选的实施方式中,所述确定所述目标对象说话结束,包括:
12、确定未接收到所述终端发送的所述目标语音信号的目标时长;
13、在所述目标时长满足第二预设条件时,则确定所述目标对象说话结束;其中,所述第二预设条件包括:所述目标时长达到预设时长。
14、在一个可选的实施方式中,所述方法,还包括:
15、接收所述终端发送的模式选择信息;其中,所述模式选择信息通过所述终端检测到针对第一展示界面的选择操作所生成的,所述第一展示界面中展示有第一模式;
16、在所述模式选择信息为所述第一模式时,执行所述在目标对象开始说话时,接收所述目标对象所在第一终端发送的目标语音信号步骤。
17、在一个可选的实施方式中,所述根据所述预设顺序关系,将多个所述目标语音信号对应的语音识别结果进行串接处理,以得到目标对象从开始说话至说话结束的过程所对应的目标语音识别结果,包括:
18、根据所述预设顺序关系,将多个所述目标语音信号对应的语音识别结果进行串接处理,以得到所述目标对象从开始说话至说话结果的过程所对应的初始语音识别结果;
19、在确定所述初始语音识别结果中包含待需处理的目标词语时,对所述目标词语进行处理,以得到处理后的所述初始语音识别结果;
20、将处理后的所述初始语音识别结果确定为目标语音识别结果。
21、在一个可选的实施方式中,所述确定所述初始语音识别结果中包含待需处理的目标词语,包括:
22、将所述初始语音识别结果与预设词语集进行匹配,所述预设词语集用于表征待需处理的所有预设词语的集合;
23、在所述初始语音识别结果与所述预设词语集匹配成功时,确定所述初始语音识别结果中包括待需处理的目标词语;其中,所述目标词语用于表征所述初始语音识别结果中存在与预设词语匹配成功的词语;
24、所述对所述目标词语进行处理,包括:
25、对所述目标词语进行模糊处理;或,
26、在所述目标词语上添加预设对象以覆盖所述目标词语。
27、在一个可选的实施方式中,所述方法,还包括:
28、在接收到所述终端发送的目标控制指令时,将展示信息发送至所述终端;其中,所述目标控制指令用于表征语音识别结束的控制指令;
29、接收所述终端发送的针对所述展示信息的反馈信息;其中,所述反馈信息包括语音识别的准确度;
30、根据所述反馈信息,对所述预设字数进行更新,以根据所述预设字数执行所述在目标对象开始说话时,接收所述目标对象所在终端发送的目标语音信号步骤。
31、第二方面,本发明实施例提供一种语音识别装置,包括:
32、接收模块,用于在目标对象开始说话时,接收所述目标对象所在终端发送的目标语音信号;
33、识别模块,用于在所述目标语音信号每满足第一预设条件时,对所述目标语音信号进行重打分处理,以得到所述目标语音信号对应的语音识别结果;其中,所述第一预设条件包括:所述目标语音信号对应的实际字数达到预设字数;
34、获取模块,用于在确定所述目标对象说话结束时,获取到多个所述目标语音信号对应的语音识别结果;
35、确定模块,用于根据多个所述目标语音信号对应的语音识别结果,确定所述目标对象从开始说话至说话结束的过程所对应的目标语音识别结果。
36、第三方面,本发明实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的语音识别程序,以实现如上所述的语音识别方法。
37、第四方面,本发明实施例提供一种存储介质,包括:所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上所述的语音识别方法。
38、本发明实施例提供的一种语音识别方法,包括:在目标对象开始说话时,接收目标对象所在终端发送的目标语音信号;在目标语音信号每满足第一预设条件时,对目标语音信号进行重打分处理,以得到目标语音信号对应的语音识别结果;其中,第一预设条件包括:目标语音信号对应的实际字数达到预设字数;在确定目标对象说话结束时,获取到多个目标语音信号对应的语音识别结果;根据多个目标语音信号对应的语音识别结果,确定目标对象从开始说话至说话结束的过程所对应的目标语音识别结果。通过以上方式,本发明实施例提供在进行语音识别时,通过分段方式对所接收到的语音信号进行识别,得到每一段语音信号对应的语音识别结果,在语音信号接收结束时,根据所有段语音识别信号对应的语音识别结果即可得到整段语音信号对应的最终语音识别结果,在接收到一段长语音信号时,降低了语音识别延迟,以及提高了用户的使用体验。