一种语音识别设备的更新方法、装置及系统的制作方法

文档序号：2835114阅读：377来源：国知局

专利名称：一种语音识别设备的更新方法、装置及系统的制作方法
技术领域：
本发明涉及语音识别技术，尤其涉及一种语音识别设备的更新方法、装置及系统。
背景技术：
语音识别技术是使得机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。其中，语音识别引擎通常包含声学模型和语言模型，其中，声学模型负责完成语音到音素(如英语中的音标、中文中拼音的声韵母)的转换，语言模型负责完成音素到文本的转换，声学模型和语言模型两者配合完成语音到文本的识别过程。现有技术中有三种语音识别技术:第一种是基于云端识别引擎的语音识别技术，第二种是基于本地语音识别引擎的语音识别技术，第三种是同时基于本地语音识别引擎和云端识别引擎的语音识别技术。然而在现有技术中，由于本地语音识别引擎的准确度较低，导致本地语音识别引擎的识别率低，影响了语音识别率。

发明内容
有鉴于此，本发明提供一种语音识别设备的更新方法、装置及系统，以提高语音识别率。为达到上述目的，本发明实施例采用如下技术方案:第一方面，本发明提供了一种语音识别设备的更新方法，包括:接收语音输入信号；利用本地语音识别设备对所述语音输入信号进行语音识别，获得本地语音识别结果;从所述本地语音识别结果和云端语音识别结果中获取最优识别结果作为最终语音识别结果，其中所述云端语音识别结果是在所述本地语音设备对所述语音输入信号进行语音识别的同时，利用所述云端语音识别设备对所述语音输入信号进行语音识别获得的；结合获取的用户反馈信息以及所述最终语音识别结果确定所述本地语音识别结果的可靠性是否满足要求；当确定所述本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对所述本地语音识别设备进行更新。在第一方面的第一种可能实现方式中，所述利用本地识别引擎对所述语音输入信号进行语音识别，获得本地语音识别结果包括:利用本地识别设备中的本地声学模型和本地语言模型分别对所述语音输入信号进行语音识别，获得本地语音识别结果。在第一方面的第二种可能实现方式中，所述从所述本地语音识别结果和从云端语音识别设备获得云端语音识别结果中获取最优识别结果作为最终语音识别结果包括:结合语音识别参数确定所述本地语音识别结果的可靠性；当所述本地语音识别结果的可靠性满足预设条件时，将所述本地语音识别结果作为所述最终语音识别结果；当所述本地语音识别结果的可靠性不满足所述预设条件时，将所述云端语音识别结果作为所述最终语音识别结果。在第一方面的第三种可能实现方式中，所述结合获取的用户反馈信息以及所述最终语音识别结果确定所述本地语音识别结果的可靠性是否满足要求包括:当获取的用户反馈信息表示所述最终语音识别结果正确且利用所述云端语音识别结果作为所述最终语音识别结果时，确定所述本地语音识别结果的可靠性不满足要求；当获取的用户反馈信息表示所述最终语音识别结果错误且由所述用户获取到正确的语音识别结果时，确定所述本地语音识别结果的可靠性不满足要求。在第一方面的第四种可能实现方式中，所述当确定所述本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对所述本地语音识别设备进行更新包括:当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的命令词识别错误，则利用从所述云端语音识别设备获得的声学模型增量更新包对所述本地语音识别设备中的本地声学模型进行更新；当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的拼音串识别正确但文本识别错误，则利用从所述云端语音识别设备获得的语言模型增量更新包对所述本地语音识别设备中的本地语言模型进行更新；当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的拼音串识别错误，则利用从所述云端语音识别设备获得的声学模型增量更新包和语言模型增量更新包分别对所述本地语音识别设备中的本地声学模型和本地语言模型进行更新。`
结合第一方面的第四种可能实现方式，在第一方面的第五种可能实现方式中，所述方法还包括:将正确的语音识别结果发送给所述云端语音识别设备。结合第一方面或第一方面的第一种或第二种或第三种可能实现方式或者结合第一方面的第五种可能实现方式，在第一方面的第六种可能实现方式中，所述方法还包括:统计所述本地语音识别结果中词语的使用频率，并将所述使用频率发送给所述云端识别设备。第二方面，本发明提供了一种语音识别设备的更新方法，包括:接收语音输入信号；利用云端语音识别设备对所述语音输入信号进行语音识别，获得云端语音识别结果;当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对本地语音识别设备进行更新；其中，所述本地语音识别结果是在所述云端语音设备对所述语音输入信号进行语音识别获得所述云端语音识别结果的同时，利用本地语音识别设备对所述语音输入信号进行语音识别获得的；所述最终语音识别结果是从所述云端语音识别结果和所述本地语音识别结果中获取的。在第二方面的第一种可能实现方式中，所述利用云端识别引擎对所述语音输入信号进行语音识别，获得云端语音识别结果包括:利用云端识别设备中的云端声学模型和云端语言模型分别对所述语音输入信号进行语音识别，获得云端语音识别结果。在第二方面的第二种可能实现方式中，当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对本地语音识别设备进行更新包括:当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，获取本地语音识别设备中需要更新的模型类型；当所述需要更新的模型类型为本地声学模型时，获取正确语音识别结果，生成声学模型增量更新包，并利用所述声学模型增量更新包对所述本地声学模型进行更新；当所述需要更新的模型类型为本地语言模型和本地声学模型时，获取正确语音识别结果，生成语言模型增量更新包和声学模型增量更新包，并利用所述语言模型增量更新包和声学模型增量更新包对所述本地语言模型和本地声学模型进行更新；当所述需要更新的模型类型为本地语言模型时，获取正确语音识别结果，生成语言模型增量更新包，并利用所述语言模型增量更新包对所述本地语言模型进行更新。结合第二方面的第一种或者第二种可能实现方式，在第二方面的第三种可能实现方式中，所述方法还包括:·
定期更新所述云端识别设备中的词汇；和/或接收所述本地语音识别设备发送的本地语音识别结果中词语的使用频率，利用所述使用频率对所述云端识别设备中的词汇进行更新。第三方面，本发明提供了一种语音识别设备的更新装置，包括:接收单元，用于接收语音输入信号；识别单元，用于利用本地语音识别设备对所述接收单元接收的语音输入信号进行语音识别，获得本地语音识别结果；选择单元，用于从所述识别单元获得的本地语音识别结果和从云端语音识别设备获得的云端语音识别结果中获取最优识别结果作为最终语音识别结果，其中所述云端语音识别结果是在所述本地语音设备对所述语音输入信号进行语音识别的同时，利用所述云端语音识别设备对所述语音输入信号进行语音识别获得的；处理单元，用于结合获取的用户反馈信息以及从所述选择单元获得的最终语音识别结果确定所述本地语音识别结果的可靠性是否满足要求；更新单元，用于当所述处理单元确定所述本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对所述本地语音识别设备进行更新。在第三方面的第一种可能实现方式中，所述识别单元具体用于利用本地识别设备中的本地声学模型和本地语言模型分别对所述语音输入信号进行语音识别，获得本地语音识别结果。在第三方面的第二种可能实现方式中，所述选择单元包括:判断模块，用于结合语音识别参数确定所述本地语音识别结果的可靠性；选择模块，用于当所述判断模块确定本地语音识别结果的可靠性满足预设条件时，将所述本地语音识别结果作为所述最终语音识别结果；当所述判断模块确定所述本地语音识别结果的可靠性不满足所述预设条件时，将所述云端语音识别结果作为所述最终语音识别结果。
在第三方面的第三种可能实现方式中，所述处理单元具体用于:当获取的用户反馈信息表示所述最终语音识别结果正确且利用所述云端语音识别结果作为所述最终语音识别结果时，确定所述本地语音识别结果的可靠性不满足要求；当获取的用户反馈信息表示所述最终语音识别结果错误且由所述用户获取到正确的语音识别结果时，确定所述本地语音识别结果的可靠性不满足要求。在第三方面的第四种可能实现方式中，所述更新单元具体用于:当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的命令词识别错误，则利用从所述云端语音识别设备获得的声学模型增量更新包对所述本地语音识别设备中的本地声学模型进行更新；当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的拼音串识别正确但文本识别错误，则利用从所述云端语音识别设备获得的语言模型增量更新包对所述本地语音识别设备中的本地语言模型进行更新；当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的拼音串识别错误，则利用从所述云端语音识别设备获得的声学模型增量更新包和语言模型增量更新包分别对所述本地语音识别设备中的本地声学模型和本地语言模型进行更新。在第三方面的第五种可能实现方式中，所述装置还包括:发送单元，用于将所述处理单元确定的正确的语音识别结果发送给所述云端语音识别设备。结合本发明的第三方面或者第三方面的第一-第五可能实现方式中的任意一种可能实现方式，在第三方·面的第六种可能实现方式中，所述装置还包括:统计单元，用于统计从所述识别单元获取的本地语音识别结果中词语的使用频率，并将所述使用频率发送给所述云端识别设备。第四方面，本发明提供了一种语音识别设备的更新装置，包括:接收单元，用于接收语音输入信号；识别单元，用于利用云端语音识别设备对所述接收单元接收的语音输入信号进行语音识别，获得云端语音识别结果；更新单元，用于当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对本地语音识别设备进行更新；其中，所述本地语音识别结果是在所述云端语音设备对所述语音输入信号进行语音识别获得所述云端语音识别结果的同时，利用本地语音识别设备对所述语音输入信号进行语音识别获得的；所述最终语音识别结果是从所述云端语音识别结果和所述本地语音识别结果中获取的。在第四方面的第一种可能实现方式中，所述识别单元具体用于:利用云端识别设备中的云端声学模型和云端语言模型分别对所述语音输入信号进行语音识别，获得云端语首识别结果。在第四方面的第二种可能实现方式中，所述更新单元包括:信息获取模块，用于当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，获取本地语音识别设备中需要更新的模型类型；
更新模块，用于当所述信息获取模块获取的需要更新的模型类型为本地声学模型时，获取正确语音识别结果，生成声学模型增量更新包，并利用所述声学模型增量更新包对所述本地声学模型进行更新；当所述需要更新的模型类型为本地语言模型和本地声学模型时，获取正确语音识别结果，生成语言模型增量更新包和声学模型增量更新包，并利用所述语言模型增量更新包和声学模型增量更新包对所述本地语言模型和本地声学模型进行更新；当所述信息获取模块获取的需要更新的模型类型为本地语言模型时，获取正确语音识别结果，生成语言模型增量更新包，并利用所述语言模型增量更新包对所述本地语言模型进行更新。在第四方面的第三种可能实现方式中，所述装置还包括:词汇更新单元，用于定期更新所述云端识别设备中的词汇；和/或用于接收所述本地语音识别设备发送的本地语音识别结果中词语的使用频率，利用所述使用频率对所述云端识别设备中的词汇进行更新。第五方面，本发明提供了一种语音识别设备更新装置系统，包括:如第三方面所述的语音识别设备更新装置以及如第四方面所述的语音识别设备更新装置。本发明实施例提供的语音识别设备的更新方法，当结合本地语音识别结果和云端语音识别结果确定本地语音识别结果不可靠时，可利用云端语音识别设备对本地语音识别设备进行更新，因而避免了现有技术中在无法获得云端语音识别结果时本地语音识别设备由于模型的限制而无法扩展的限制，因此，利用本发明实施例的方法、装置和系统，提高了语音识别率。

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1为本发明实施例一的语音识别设备的更新方法的流程图；图2为本发明实施例三的语音识别设备的更新方法的流程图；图3为本发明实施例四的语音识别设备的更新装置示意图；图4为本发明实施例四的语音识别设备的更新装置示意图；图5为本发明实施例五的语音识别设备的更新装置示意图；图6为本发明实施例五的语音识别设备的更新装置的结构图。
具体实施例方式下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。如图1所示，本发明实施例一的语音识别设备的更新方法包括:
步骤11、本地语音识别设备接收语音输入信号。在此步骤中，首先启动本地语音识别设备的语音识别类软件，当用户开始说话时，本地语音识别设备即接收语音输入信号。步骤12、利用本地语音识别设备对所述语音输入信号进行语音识别，获得本地语首识别结果。在此步骤中，主要是利用本地识别设备中的本地声学模型和本地语言模型分别对所述语音输入信号进行语音识别，获得本地语音识别结果。其中，本地声学模型和本地语言模型的具体的识别方法和现有技术中的相同，在此不再赘述。步骤13、从所述本地语音识别结果和云端语音识别结果中获取最优识别结果作为最终语音识别结果，其中所述云端语音识别结果是在所述本地语音设备对所述语音输入信号进行语音识别的同时，利用所述云端语音识别设备对所述语音输入信号进行语音识别获得的。在此步骤中，首先结合应用上下文环境、置信度等语音识别参数确定所述本地语音识别结果的可靠性，即确定本地语音识别结果的准确性是否满足要求。其中，应用上下文环境指的是用户使用的场景的一些信息，如用户前一次语音为“打电话”，则之后进行语音识别时用户使用的场景应该就是人名的识别；如用户前一次语音为“发短信给张三”，则之后进行语音识别时用户使用的场景应该就是短信内容的听写识别。置信度指的是识别结果的可信任程度，取值一般在0-100之间，如识别结果“张三”的置信度为80，则表明其可靠性较高，则该识别结果可以接受；又如“李四”的置信度为20，则表明其可靠性较差，则该识别结果可以拒绝。在选取最终识别结果时，如果本地语音识别结果的可靠性满足预设条件，则将所述本地语音识别结果作为所述最终语音识别结果。如果所述本地语音识别结果的可靠性不满足所述预设条件，由于存在一定的网络时延，则会继续等待云端语音识别结果，然后将所述云端语音识别结果作为所述最终语音识别结果。例如，所述预设条件可以为置信度为90。如果本地语音识别结果的置信度为90以上，则将本地语音识别结果作为最终语音识别结果，否则将云端语音识别结果作为最终语音识别结果。步骤14、结合获取的用户反馈信息以及所述最终语音识别结果确定所述本地语音识别结果的可靠性是否满足要求。在此步骤中，所述最终语音识别结果需要通过用户界面(User Interface, UI)提供给用户，供用户操作，然后再根据用户的操作获取用户反馈信息。而对最终语音识别结果的判断是通过获取的用户反馈信息来决定的。例如，如在本地命令词识别中，用户取消了相应的操作，则获取的用户反馈信息表示最终识别结果错误；在短信听写中，用户修改了短信文本，则获取的用户反馈信息表示最终识别结果错误，但是修改后的文本为正确识别结果。由此可以看出，在获取用户反馈信息的同时，还可确定正确的语音识别结果。此外，当获得正确的语音识别结果后，还可将正确的语音识别结果发送给所述云端语音识别设备。因此，在此步骤中，当获取的用户反馈信息表示所述最终语音识别结果正确且利用所述云端语音识别结果作为所述最终语音识别结果时，确定所述本地语音识别结果的可靠性不满足要求。当获取的用户反馈信息表示所述最终语音识别结果错误且由所述用户获取到正确的语音识别结果时，确定所述本地语音识别结果的可靠性不满足要求。
而如果最终语音识别结果正确且本地语音识别结果正确，则用户无需进行任何操作，也就无需获得用户反馈信息。或者，最终语音识别结果错误，但是用户没有反馈正确识别结果，那么也无需获得用户反馈信息。步骤15、当确定所述本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对所述本地语音识别设备进行更新。在此步骤中，当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的命令词识别错误，则利用从所述云端语音识别设备获得的声学模型增量更新包对所述本地语音识别设备中的本地声学模型进行更新。当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的拼音串识别正确但文本识别错误，则利用从所述云端语音识别设备获得的语言模型增量更新包对所述本地语音识别设备中的本地语言模型进行更新。当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的拼音串识别错误，则利用从所述云端语音识别设备获得的声学模型增量更新包和语言模型增量更新包分别对所述本地语音识别设备中的本地声学模型和本地语言模型进行更新。具体的，本地命令词识别及本地听写识别都是位于本地识别设备中，是本地识别设备的两种功能。其中，本地命令词识别主要用于对固定的句型、人名、命令词的识别等，如“打电话给张三”、“打开音乐播放器”等固定命令词；本地听写识别主要用于对连续语音的识别，如短信内容的听写，如“今天晚饭吃了吗？ ”等。在本地命令词识别中，如果用户期望的命令词为“打电话给张三”，但最终语音识别结果为“打电话给李四”，则用户会取消这个最终语音识别结果，或从备选列表(如果有的话)选取“李四”，以标识最终语音识别结果识别错误。那么通过用户的此种操作，即可获知最终语音识别结果是错误的。又例如，在短信听写中，如果用户对最终语音识别结果作了修改，则表明最终语音识别结果中的听写内容有误，且可以获取用户修改后的文本作为最终语音识别结果。在此种情况下，可确定需要对本地声学模型进行更新。因此，需利用从所述云端语音识别设备获得的声学模型增量更新包对所述本地语音识别设备中的本地声学模型进行更新。在本地听写识别中，例如，最终语音识别结果中为“中国队表现十分给立”，用户修改后的最终语音识别结果为“中国队表现十分给力”，“立”与“力”拼音串相同，此时，确定对所述本地语音识别设备中的本地语言模型进行更新。又例如，最终语音识别结果中为“春节晚会很明白”，而用户修改后的最终语音识别结果最终结果为“春节晚会很精彩”，此时，确定对所述本地语音识别设备中的本地语言模型和本地声学模型都进行更新。由上可以看出，本发明实施例一的语音识别设备的更新方法，当结合本地语音识别结果和云端语音识别结果确定本地语音识别结果不可靠时，可利用云端语音识别设备对本地语音识别设备进行更新，因而避免了现有技术中在无法获得云端语音识别结果时本地语音识别设备由于模型的限制而无法扩展的限制，因此，利用本发明实施例的方法，提高了语音识别率。在本发明实施例一的基础上，本发明实施例而的语音识别设备的更新方法还包括:统计所述本地语音识别结果中词语的使用频率，并将所述使用频率发送给所述云端识别设备。例如，可按照设定的时间间隔，如每月，统计所述本地语音识别结果中热频词的使用频率，并将所述使用频率发送给所述云端识别设备，以扩充本地语音识别中热频词的识别。如图2所示，本发明实施例三的语音识别设备的更新方法包括:步骤21、云端语音识别设备接收语音输入信号。在此步骤中，与步骤11类似的，首先启动云端语音识别设备的语音识别类软件，当用户开始说话时，云端语音识别设备即接收语音输入信号。步骤22、利用云端语音识别设备对所述语音输入信号进行语音识别，获得云端语首识别结果。在此步骤中，主要是利用云端识别设备中的云端声学模型和云端语言模型分别对所述语音输入信号进行语音识别，获得云端语音识别结果。其中，云端声学模型和云端语言模型的具体的识别方法和现有技术中的相同，在此不再赘述。步骤23、当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对本地语音识别设备进行更新；其中，所述本地语音识别结果是在所述云端语音设备对所述语音输入信号进行语音识别获得所述云端语音识别结果的同时，利用本地语音识别设备对所述语音输入信号进行语音识别获得的；所述最终语音识别结果是从所述云端语音识别结果和所述本地语音识别结果中获取的。在此步骤中，当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，获取本地语音识别设备中需要更新的模型类型。当所述需要更新的模型类型为本地声学模型时，获取正确语音识别结果，生成声学模型增量更新包，并利用所述声学模型增量更新包对所述本地声学模型进行更新；当所述需要更新的模型类型为本地语言模型和本地声学模型时，获取正确语音识别结果，生成语言模型增量更新包和声学模型增量更新包，并利用所述语言模型增量更新包和声学模型增量更新包对所述本地语言模型和本地声学模型进行更新；当所述需要更新的模型类型为本地语言模型时，获取正确语音识别结果，生成语言模型增量更新包，并利用所述语言模型增量更新包对所述本地语言模型进行更新。由上可以看出，本发明实施例二的语音识别设备的更新方法，当结合本地语音识别结果和云端语音识别结果确定本地语音识别结果不可靠时，可利用云端语音识别设备对本地语音识别设备进行更新，因而避免了现有技术中在无法获得云端语音识别结果时本地语音识别设备由于模型的限制而无法扩展的限制，因此，利用本发明实施例的方法，提高了语音识别率。在本发明实施例三的基础上，本发明实施例四的语音识别设备的更新方法还可包括:定期(如每月等)更新所述云端识别设备中的词汇。以及所述云端识别设备还可接收所述本地语音识别设备发送的本地语音识别结果中词语的使用频率，利用所述使用频率对所述云端识别设备中的词汇进行更新，以进一步提高识别率。如图3所示，本发明实施例四的语音识别设备的更新装置，包括:接收单元3 1，用于接收语音输入信号；识别单元32，用于利用本地语音识别设备对所述接收单元接收的语音输入信号进行语音识别，获得本地语音识别结果；选择单元33，用于从所述识别单元获得的本地语音识别结果和从云端语音识别设备获得的云端语音识别结果中获取最优识别结果作为最终语音识别结果，其中所述云端语音识别结果是在所述本地语音设备对所述语音输入信号进行语音识别的同时，利用所述云端语音识别设备对所述语音输入信号进行语音识别获得的；处理单元34，用于结合获取的用户反馈信息以及从所述选择单元获得的最终语音识别结果确定所述本地语音识别结果的可靠性是否满足要求；更新单元35，用于当所述处理单元确定所述本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对所述本地语音识别设备进行更新。其中，所述识别单元32具体用于利用本地识别设备中的本地声学模型和本地语言模型分别对所述语音输入信号进行语音识别，获得本地语音识别结果。所述选择单元33可包括:判断模块，用于结合语音识别参数确定所述本地语音识别结果的可靠性；选择模块，用于当所述判断模块确定本地语音识别结果的可靠性满足预设条件时，将所述本地语音识别结果作为所述最终语音识别结果；当所述判断模块确定所述本地语音识别结果的可靠性不满足所述预设条件时，将所述云端语音识别结果作为所述最终语音识别结果。所述处理单元34具体用于:当获取的用户反馈信息表示所述最终语音识别结果正确且利用所述云端语音识别结果作为所述最终语音识别结果时，确定所述本地语音识别结果的可靠性不满足要求；当获取的用户反馈信息表示所述最终语音识别结果错误且由所述用户获取到正确的语音识别结果时，确定所述本地语音识别结果的可靠性不满足要求。所述更新单元35具体用于:当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的命令词识别错误，则利用从所述云端语音识别设备获得的声学模型增量更新包对所述本地语音识别设备中的本地声学模型进行更新；当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的拼音串识别正确但文本识别错误，则利用从所述云端语音识别设备获得的语言模型增量更新包对所述本地语音识别设备中的本地语言模型进行更新；当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的拼音串识别错误，则利用从所述云端语音识别设备获得的声学模型增量更新包和语言模型增量更新包分别对所述本地语音识别设备中的本地声学模型和本地语言模型进行更新。由上可以看出，本发明实施例四的语音识别设备的更新装置，当结合本地语音识别结果和云端语音识别结果确定本地语音识别结果不可靠时，可利用云端语音识别设备对本地语音识别设备进行更新，因而避免了现有技术中在无法获得云端语音识别结果时本地语音识别设备由于模型的限制而无法扩展的限制，因此，利用本发明实施例的装置，提高了语音识别率。如图4所示，所述装置还可包括:发送单元41，用于将所述处理单元确定的正确的语音识别结果发送给所述云端语音识别设备；统计单元42，用于统计从所述识别单元获取的本地语音识别结果中词语的使用频率，并将所述使用频率发送给所述云端识别设备。如图5所示，本发明实施例五的语音识别设备的更新装置，包括:接收单元51，用于接收语音输入信号；识别单元52，用于利用云端语音识别设备对所述接收单元接收的语音输入信号进行语音识别，获得云端语音识别结果；更新单元53，用于当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对本地语音识别设备进行更新；其中，所述本地语音识别结果是在所述云端语音设备对所述语音输入信号进行语音识别获得所述云端语音识别结果的同时，利用本地语音识别设备对所述语音输入信号进行语音识别获得的；所述最终语音识别结果是从所述云端语音识别结果和所述本地语音识别结果中获取的。其中，所述识别单元52具体用于:利用云端识别设备中的云端声学模型和云端语言模型分别对所述语音输入信号进行语音识别，获得云端语音识别结果。所述更新单元53可包括:信息获取模块，用于当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，获取本地语音识别设备中需要更新的模型类型；更新模块，用于当所述信息获取模块获取的需要更新的模型类型为本地声学模型时，获取正确语音识别结果，生成声学模型增量更新包，并利用所述声学模型增量更新包对所述本地声学模型进行更新；当所述需要更新的模型类型为本地语言模型和本地声学模型时，获取正确语音识别结果，生成语言模型增量更新包和声学模型增量更新包，并利用所述语言模型增量更新包和声学模型增量更新包对所述本地语言模型和本地声学模型进行更新；当所述信息获取模块获取的需要更新的模型类型为本地语言模型时，获取正确语音识别结果，生成语言模型增量更新包，并利用所述语言模型增量更新包对所述本地语言模型进行更新。由上可以看出，本发明实施例五的语音识别设备的更新装置，当结合本地语音识别结果和云端语音识别结果确定本地语音识别结果不可靠时，可利用云端语音识别设备对本地语音识别设备进行更新，因而避免了现有技术中在无法获得云端语音识别结果时本地语音识别设备由于模型的限制而无法扩展的限制，因此，利用本发明实施例的装置，提高了语音识别率。如图6所示，本发明实施例五的语音识别设备的更新装置还可包括:词汇更新单元 54，用于定期更新所述云端识别设备中的词汇；和/或用于接收所述本地语音识别设备发送的本地语音识别结果中词语的使用频率，利用所述使用频率对所述云端识别设备中的词汇进行更新。其中，本发明实施例的语音设备的更新装置的工作原理可参照前述方法是市里的描述。此外，本发明实施例还提供了一种语音识别设备的更新系统，包括实施例四和实施例五所述的语音设备的更新装置。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(Random Acces sMemory, RAM)等。以上所述，仅为本发明的具体实施方式
，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。
权利要求
1.一种语音识别设备的更新方法，其特征在于，包括: 接收语音输入信号；利用本地语音识别设备对所述语音输入信号进行语音识别，获得本地语音识别结果；从所述本地语音识别结果和云端语音识别结果中获取最优识别结果作为最终语音识别结果，其中所述云端语音识别结果是在所述本地语音设备对所述语音输入信号进行语音识别的同时，利用所述云端语音识别设备对所述语音输入信号进行语音识别获得的；结合获取的用户反馈信息以及所述最终语音识别结果确定所述本地语音识别结果的可靠性是否满足要求；当确定所述本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对所述本地语音识别设备进行更新。
2.根据权利要求1所述的方法，其特征在于，所述利用本地识别引擎对所述语音输入信号进行语音识别，获得本地语音识别结果包括: 利用本地识别设备中的本地声学模型和本地语言模型分别对所述语音输入信号进行语音识别，获得本地语音识别结果。
3.根据权利要求1所述的方法，其特征在于，所述从所述本地语音识别结果和从云端语音识别设备获得云端语音识别结果中获取最优识别结果作为最终语音识别结果包括: 结合语音识别参数确定所述本地语音识别结果的可靠性；当所述本地语音识别结果的可靠性满足预设条件时，将所述本地语音识别结果作为所述最终语音识别结果；当所述本地语音识别结果的可靠性不满足所述预设条件时，将所述云端语音识别结果作为所述最终语音识别结果。
4.根据权利要求1所述的方法，其特征在于，所述结合获取的用户反馈信息以及所述最终语音识别结果确定所述本地语音识别结果的可靠性是否满足要求包括: 当获取的用户反馈信息表示所述最终语音识别结果正确且利用所述云端语音识别结果作为所述最终语音识别结果时，确定所述本地语音识别结果的可靠性不满足要求；当获取的用户反馈信息表示所述最终语音识别结果错误且由所述用户获取到正确的语音识别结果时，确定所述本地语音识别结果的可靠性不满足要求。
5.根据权利要求1所述的方法，其特征在于，所述当确定所述本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对所述本地语音识别设备进行更新包括: 当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的命令词识别错误，则利用从所述云端语音识别设备获得的声学模型增量更新包对所述本地语音识别设备中的本地声学模型进行更新；当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的拼音串识别正确但文本识别错误，则利用从所述云端语音识别设备获得的语言模型增量更新包对所述本地语音识别设备中的本地语言模型进行更新；当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的拼音串识别错误，则利用从所述云端语音识别设备获得的声学模型增量更新包和语言模型增量更新包分别对所述本地语音识别设备中的本地声学模型和本地语言模型进行更新。
6.根据权利要求4所述的方法，其特征在于，所述方法还包括: 将正确的语音识别结果发送给所述云端语音识别设备。
7.根据权利要求1-6任一所述的方法，其特征在于，所述方法还包括: 统计所述本地语音识别结果中词语的使用频率，并将所述使用频率发送给所述云端识别设备。
8.一种语音识别设备的更新方法，其特征在于，包括: 接收语音输入信号；利用云端语音识别设备对所述语音输入信号进行语音识别，获得云端语音识别结果；当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对本地语音识别设备进行更新；其中，所述本地语音识别结果是在所述云端语音设备对所述语音输入信号进行语音识别获得所述云端语音识别结果的同时，利用本地语音识别设备对所述语音输入信号进行语音识别获得的；所述最终语音识别结果是从所述云端语音识别结果和所述本地语音识别结果中获取的。
9.根据权利要求8所述的方法，其特征在于，所述利用云端识别引擎对所述语音输入信号进行语音识别，获得云端语音识别结果包括: 利用云端识别设备中的云端声学模型和云端语言模型分别对所述语音输入信号进行语音识别，获得云端语音识别结果。
10.根据权利要求8所述的方法，其特征在于，当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对本地语音识别设备进行更新包括: 当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，获取本地语音识别设备中需要更新的模型类型；当所述需要更新的模型类型为本地声学模型时，获取正确语音识别结果，生成声学模型增量更新包，并利用所述声学模型增量更新包对所述本地声学模型进行更新；当所述需要更新的模型类型为本地语言模型和本地声学模型时，获取正确语音识别结果，生成语言模型增量更新包和声学模型增量更新包，并利用所述语言模型增量更新包和声学模型增量更新包对所述本地语言模型和本地声学模型进行更新；当所述需要更新的模型类型为本地语言模型时，获取正确语音识别结果，生成语言模型增量更新包，并利用所述语言模型增量更新包对所述本地语言模型进行更新。
11.根据权利要求8-10任一所述的方法，其特征在于，所述方法还包括: 定期更新所述云端识别设备中的词汇；和/或接收所述本地语音识别设备发送的本地语音识别结果中词语的使用频率，利用所述使用频率对所述云端识别设备中的词汇进行更新。
12.—种语音识别设备的更新装置，其特征在于，包括: 接收单元，用于接收语音输入信号；识别单元，用于利用本地语音识别设备对所述接收单元接收的语音输入信号进行语音识别，获得本地语音识别结果；选择单元，用于从所述识别单元获得的本地语音识别结果和从云端语音识别设备获得的云端语音识别结果中获取最优识别结果作为最终语音识别结果，其中所述云端语音识别结果是在所述本地语音设备对所述语音输入信号进行语音识别的同时，利用所述云端语音识别设备对所述语音输入信号进行语音识别获得的；处理单元，用于结合获取的用户反馈信息以及从所述选择单元获得的最终语音识别结果确定所述本地语音识别结果的可靠性是否满足要求；更新单元，用于当所述处理单元确定所述本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对所述本地语音识别设备进行更新。
13.根据权利要求12所述的装置，其特征在于，所述识别单元具体用于利用本地识别设备中的本地声学模型和本地语言模型分别对所述语音输入信号进行语音识别，获得本地语音识别结果。
14.根据权利要求12所述的装置，其特征在于，所述选择单元包括: 判断模块，用于结合语音识别参数确定所述本地语音识别结果的可靠性；选择模块，用于当所述判断模块确定本地语音识别结果的可靠性满足预设条件时，将所述本地语音识别结果作为所述最终语音识别结果；当所述判断模块确定所述本地语音识别结果的可靠性不满足所述预设条件时，将所述云端语音识别结果作为所述最终语音识别结果。
15.根据权利要求12所述的装置，其特征在于，所述处理单元具体用于: 当获取的用户反馈信息表示所述最终语音识别结果正确且利用所述云端语音识别结果作为所述最终语音识别结果时，确定所述本地语音识别结果的可靠性不满足要求；当获取的用户反馈信息表示所述最终语音识别结果错误且由所述用户获取到正确的语音识别结果时，确定所述本地语音识别结`果的可靠性不满足要求。
16.根据权利要求12所述的装置，其特征在于，所述更新单元具体用于: 当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的命令词识别错误，则利用从所述云端语音识别设备获得的声学模型增量更新包对所述本地语音识别设备中的本地声学模型进行更新；当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的拼音串识别正确但文本识别错误，则利用从所述云端语音识别设备获得的语言模型增量更新包对所述本地语音识别设备中的本地语言模型进行更新；当确定所述本地语音识别结果的可靠性不满足要求时，如果确定所述本地语音识别结果中的拼音串识别错误，则利用从所述云端语音识别设备获得的声学模型增量更新包和语言模型增量更新包分别对所述本地语音识别设备中的本地声学模型和本地语言模型进行更新。
17.根据权利要求15所述的装置，其特征在于，所述装置还包括: 发送单元，用于将所述处理单元确定的正确的语音识别结果发送给所述云端语音识别设备。
18.根据权利要求12-16任一所述的装置，其特征在于，所述装置还包括: 统计单元，用于统计从所述识别单元获取的本地语音识别结果中词语的使用频率，并将所述使用频率发送给所述云端识别设备。
19.一种语音识别设备的更新装置，其特征在于，包括: 接收单元，用于接收语音输入信号；识别单元，用于利用云端语音识别设备对所述接收单元接收的语音输入信号进行语音识别，获得云端语音识别结果；更新单元，用于当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，利用所述云端语音识别设备对本地语音识别设备进行更新；其中，所述本地语音识别结果是在所述云端语音设备对所述语音输入信号进行语音识别获得所述云端语音识别结果的同时，利用本地语音识别设备对所述语音输入信号进行语音识别获得的；所述最终语音识别结果是从所述云端语音识别结果和所述本地语音识别结果中获取的。
20.根据权利要求19所述的装置，其特征在于，所述识别单元具体用于:利用云端识别设备中的云端声学模型和云端语言模型分别对所述语音输入信号进行语音识别，获得云端语音识别结果。
21.根据权利要求19所述的装置，其特征在于，所述更新单元包括: 信息获取模块，用于当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性不满足要求时，获取本地语音识别设备中需要更新的模型类型；更新模块，用于当所述信息获取模块获取的需要更新的模型类型为本地声学模型时，获取正确语音识别结果，生成声学模型增量更新包，并利用所述声学模型增量更新包对所述本地声学模型进行更新；当所述需要更新的模型类型为本地语言模型和本地声学模型时，获取正确语音识别结果，生成语言模型增量更新包和声学模型增量更新包，并利用所述语言模型增量更新包和声学模型增量更新包对所述本地语言模型和本地声学模型进行更新；当所述信息获取模块获取的需要更新的模型类型为本地语言模型时，获取正确语音识别结果，生成语言模型增量更新包，并利用所述语言模型增量更新包对所述本地语言模型进行更新。
22.根据权利要求19所述的装置，其特征在于，所述装置还包括: 词汇更新单元，用于定期更新所述云端识别设备中的词汇；和/或用于接收所述本地语音识别设备发送的本地语音识别结果中词语的使用频率，利用所述使用频率对所述云端识别设备中的词汇进行更新。
23.一种语音识别设备更新装置系统，其特征在于，包括: 如权利要求12-18任一所述的语音识别设备更新装置以及如权利要求19-22任一所述的语音识别设备更新装置。
全文摘要
本发明公开一种语音识别设备的更新方法、装置及系统，涉及语音识别技术，为提高语音识别率而发明。方法包括接收语音输入信号；利用本地语音识别设备对语音输入信号进行语音识别，获得本地语音识别结果；从本地语音识别结果和云端语音识别结果中获取最优识别结果作为最终语音识别结果，其中云端语音识别结果是在本地语音设备对语音输入信号进行语音识别的同时，利用云端语音识别设备对语音输入信号进行语音识别获得的；结合获取的用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性是否满足要求；当确定本地语音识别结果的可靠性不满足要求时，利用云端语音识别设备对本地语音识别设备进行更新。
文档编号G10L15/34GK103247291SQ20131016391
公开日2013年8月14日申请日期2013年5月7日优先权日2013年5月7日
发明者徐丹华, 蒋洪睿, 郑伟军, 王细勇, 王青申请人:华为终端有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐丹华;蒋洪睿;郑伟军;王细勇;王青
技术所有人：华为终端有限公司
我是此专利的发明人

上一篇：一种脉冲波形驱动器及电磁式蜂鸣器的制作方法
上一篇：24孔48音船形半音阶口琴的制作方法