语音识别方法及装置、存储介质、终端与流程

文档序号：16188378发布日期：2018-12-08 05:26阅读：171来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明涉及语音处理技术领域，尤其涉及一种语音识别方法及装置、存储介质、终端。

背景技术

现有技术中，在对用户的语音进行语音识别时，通常是基于知识库中存储的词语进行的。知识库中可以预先存储有生活常用词、领域专业词等。

但是，知识库中未存储人名、地名、品牌名等特有名词时，用户语音输入上述词语时，出现识别错误，用户体验差。

技术实现要素：

本发明解决的技术问题是如何提高对特有名词的识别准确性。

为解决上述技术问题，本发明实施例提供一种语音识别方法，语音识别方法包括：进入特有名词识别模式；获取用户输入的语音，并对所述语音进行识别，得到识别结果；当所述识别结果中存在满足预设组合规则的词语组合时，仅保留所述词语组合中的同音字，所述词语组合包括顺序排列的名词、预设关联词以及所述名词的同音字。

可选的，所述保留所述词语组合中的同音字包括：确定所述名词中与所述同音字同音的至少一个字；保留所述至少一个字。

可选的，所述进入特有名词识别模式包括：响应于所述用户的触发命令，进入所述特有名词识别模式。

可选的，所述语音识别方法还包括：将保留后的识别结果反馈至所述用户或存储至词库中。

可选的，所述名词选自人名、地名、物名或品牌名。

可选的，所述预设关联词选自的或地。

为解决上述技术问题，本发明实施例还公开了一种语音识别装置，语音识别装置包括：模式进入模块，适于进入特有名词识别模式；语音识别模块，适于获取用户输入的语音，并对所述语音进行识别，得到识别结果；处理模块，适于当所述识别结果中存在满足预设组合规则的词语组合时，仅保留所述词语组合中的同音字，所述词语组合包括顺序排列的名词、预设关联词以及所述名词的同音字。

可选的，所述处理模块包括：确定单元，适于确定所述名词中与所述同音字同音的至少一个字；保留单元，适于保留所述至少一个字。

可选的，所述模式进入模块响应于所述用户的触发命令，进入所述特有名词识别模式。

可选的，所述语音识别装置还包括：反馈模块，适于将保留后的识别结果反馈至所述用户或存储至词库中。

可选的，所述名词选自人名、地名、物名或品牌名。

可选的，所述预设关联词选自的或地。

本发明实施例还公开了一种存储介质，其上存储有计算机指令，所述计算机指令运行时执行所述语音识别方法的步骤。

本发明实施例还公开了一种终端，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行所述语音识别方法的步骤。

与现有技术相比，本发明实施例的技术方案具有以下有益效果：

本发明技术方案进入特有名词识别模式；获取用户输入的语音，并对所述语音进行识别，得到识别结果；当所述识别结果中存在满足预设组合规则的词语组合时，仅保留所述词语组合中的同音字，所述词语组合包括顺序排列的名词、预设关联词以及所述名词的同音字。本发明技术方案考虑到用户对特有名词的朗读习惯，通过在特有名词识别模式下，对满足预设组合规则的词语组合进行处理，也即仅保留所述词语组合中的同音字，可以实现对特有名词例如人名、地名等的识别，提高了对语音识别的准确性，提升用户体验。

进一步地，确定所述名词中与所述同音字同音的至少一个字；保留所述至少一个字。本发明技术方案中，词语组合中名词存在与同音字同音的至少一个字，该至少一个字是用户所要表达的字，因此可以将该至少一个字保留下来，作为最终的识别结果，用于后续的步骤。由此，可以避免保留错误的同音字，实现了对特有名词识别的准确性。

进一步地，响应于所述用户的触发命令，进入所述特有名词识别模式。由于特有名词识别模式下会执行额外操作也即对特有名词进行识别操作，功耗较大，因此本发明技术方案中，在用户下达触发命令时才进入特有名词识别模式，可以在减小功耗的基础上实现对特有名词的语音识别。

附图说明

图1是本发明实施例一种语音识别方法的流程图；

图2是本发明实施例另一种语音识别方法的流程图；

图3是本发明实施例一种语音识别装置的结构示意图。

具体实施方式

如背景技术中所述，知识库中未存储人名、地名、品牌名等特有名词时，用户语音输入上述词语时，出现识别错误，用户体验差。

本发明技术方案考虑到用户对特有名词的朗读习惯，通过在特有名词识别模式下，对满足预设组合规则的词语组合进行处理，也即仅保留所述词语组合中的同音字，可以实现对特有名词例如人名、地名等的识别，提高了对语音识别的准确性，提升用户体验。

为使本发明的上述目的、特征和优点能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。

图1是本发明实施例一种语音识别方法的流程图。

图1所示语音识别方法可以由计算机执行，例如可以通过编写计算机程序指令并运行该指令来执行，并能够运行于任意的终端设备，例如手机、电脑等。

图1所示语音识别方法可以包括以下步骤：

步骤s101：进入特有名词识别模式；

步骤s102：获取用户输入的语音，并对所述语音进行识别，得到识别结果；

步骤s103：当所述识别结果中存在满足预设组合规则的词语组合时，仅保留所述词语组合中的同音字，所述词语组合包括顺序排列的名词、预设关联词以及所述名词的同音字。

在步骤s101的具体实施中，终端设备可以进入特有名词识别模式。在进入该特有名词识别模式后，可以触发后续步骤中对满足预设组合规则的词语组合的处理。

具体地，终端设备在处于非特有名词识别模式时，如果获取到用户输入的语音，则直接对所述语音进行识别得到识别结果，该识别结果无需再做其他处理。也就是说，对语音进行识别得到的识别结果中的全部文字将被保留下来。

相应地，在终端设备处于特有名词识别模式时，如果获取到用户的语音，则先对语音进行语音识别，得到识别结果。所述识别结果包括对所述语音识别得到的全部文字。

具体地，获取用户输入的语音的具体方式可以是直接接收用户输入的语音，也可以是从其他设备、应用程序或数据库中调取得到的。

可以理解的是，对语音进行语音识别的具体过程可以采用任意可实施的现有算法，本发明实施例对此不做限制。

进而在步骤s103的具体实施中，终端设备处于特有名词识别模式，表示可以对识别结果中满足预设组合规则的词语组合进行处理。预设组合规则可以是预先设定的。预设组合规则可以是名词+预设关联词+名词的同音字。由此，词语组合满足预设组合规则是指词语组合包括顺序排列的名词、预设关联词以及所述名词的同音字。例如，词语组合为“刘备的刘”以及“张飞的飞”。

具体地，如果识别结果中存在满足预设组合规则的词语组合，则仅保留词语组合中的同音字。词语组合中的名词和预设关联词可以被剔除。例如，对于词语组合“刘备的刘”，仅保留同音字“刘”；对于词语组合“张飞的飞”，仅保留同音字“飞”。

本实施例中，保留下来的同音字为特有名词。进一步地，特有名词为保留下来的相邻同音字组合，也即人名、地名或品牌名。换言之，在用户按照预设组合规则输入语音时，本发明实施例可以基于预设组合规则解析出特有名词。

本实施例中，仅保留所述词语组合中的同音字是指将所述同音字替换所述词语组合。例如，将“飞”替换“张飞的飞”。

需要说明的是，根据不同的应用场景或不同的用户表达习惯，可以设置不同的预设组合规则。

本发明一个具体应用场景中，用户输入语音“我同事的名字是刘备的刘张飞的飞”。现有技术中对该语音的识别结果为“我同事的名字是刘备的刘张飞的飞”。而本发明实施例经过图1所示步骤s101至步骤s103的处理后，最终识别结果为“我同事的名字是刘飞”。由上可知，相对于现有技术的语音识别结果，本发明实施例可以实现对特有名词的精准识别，提高语音识别的准确性。

在本发明的具体应用中，所述名词可以选自人名、地名、物名或品牌名。所述预设关联词选自的或地。

需要说明的是，在不同的应用场景下，所述名词和所述预设关联词也可以自定义配置，本发明实施例对此不做限制。

本发明一个具体实施例中，图1所示步骤s103可以包括以下步骤：确定所述名词中与所述同音字同音的至少一个字；保留所述至少一个字。

具体实施中，考虑到采用的语音识别算法的不同，在识别结果中，所述名词的同音字可以与名词中的字相同，也可以与名词中的字不同。例如，用户输入语音为“张飞的飞”，识别结果可以是“张飞的飞”，也可以是“张飞的非”。

为了保证对特有名词的识别准确性，避免保留错误的字，可以先确定名词中与所述同音字同音的至少一个字，并将该至少一个字保留下来。例如，不论识别结果是“张飞的飞”或“张飞的非”，确定“张飞”与“非”或“飞”同音的字为“飞”，那么最终保留的字为“飞”。

本发明一个具体实施例中，图1所示步骤s101可以包括以下步骤：响应于所述用户的触发命令，进入所述特有名词识别模式。

具体地，用户的触发命令可以是语音、手势操作、触屏操作或按键操作等。

由于特有名词识别模式下会执行额外操作也即对特有名词进行识别操作，功耗较大，因此本发明实施例中，在用户下达触发命令时才进入特有名词识别模式，可以在减小功耗的基础上实现对特有名词的语音识别。

本发明一个优选实施例中，图1所示步骤s103之后还可以包括以下步骤：将保留后的识别结果反馈至所述用户或存储至词库中。

具体而言，对识别结果中所有的词语组合进行处理，仅保留词语组合中的同音字后，得到保留后的识别结果。保留后的识别结果为最终识别结果，保留后的识别结果可以反馈至用户。也可以将保留后的识别结果存储至词库中，词库中新增了本次语音识别得到的特有名词，从而在后续进行语音识别时，可以直接识别得到该特有名词的识别结果。

请参照图3，本发明实施例还公开了一种语音识别装置30。语音识别装置30可以包括模式进入模块301、语音识别模块302和处理模块303。

其中，模式进入模块301适于进入特有名词识别模式；语音识别模块302适于获取用户输入的语音，并对所述语音进行识别，得到识别结果；处理模块303适于当所述识别结果中存在满足预设组合规则的词语组合时，仅保留所述词语组合中的同音字，所述词语组合包括顺序排列的名词、预设关联词以及所述名词的同音字。

终端设备处于特有名词识别模式，表示可以对识别结果中满足预设组合规则的词语组合进行处理。预设组合规则可以是预先设定的。预设组合规则可以是名词+预设关联词+名词的同音字。由此，词语组合满足预设组合规则是指词语组合包括顺序排列的名词、预设关联词以及所述名词的同音字。例如，词语组合为“刘备的刘”以及“张飞的飞”。

本发明实施例考虑到用户对特有名词的朗读习惯，通过在特有名词识别模式下，对满足预设组合规则的词语组合进行处理，也即仅保留所述词语组合中的同音字，可以实现对特有名词例如人名、地名等的识别，提高了对语音识别的准确性，提升用户体验。

本发明一个具体实施例中，图3所示处理模块303可以包括确定单元(图未示)，适于确定所述名词中与所述同音字同音的至少一个字；保留单元(图未示)，适于保留所述至少一个字。

本发明另一个具体实施例中，所述模式进入模块301响应于所述用户的触发命令，进入所述特有名词识别模式。

图3所示的语音识别装置30还可以包括反馈模块(图未示)，适于将保留后的识别结果反馈至所述用户或存储至词库中。

关于所述语音识别装置30的工作原理、工作方式的更多内容，可以参照图1至图2中的相关描述，这里不再赘述。

本发明实施例还公开了一种存储介质，其上存储有计算机指令，所述计算机指令运行时可以执行图1或图2中所示的语音识别方法的步骤。所述存储介质可以包括rom、ram、磁盘或光盘等。所述存储介质还可以包括非挥发性存储器(non-volatile)或者非瞬态(non-transitory)存储器等。

本发明实施例还公开了一种终端，所述终端可以包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机指令。所述处理器运行所述计算机指令时可以执行图1或图2中所示的语音识别方法的步骤。所述终端包括但不限于手机、计算机、平板电脑等终端设备。

虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王华勇
技术所有人：上海小蚁科技有限公司
我是此专利的发明人

上一篇：一种具有升降功能的花盆架的制作方法
上一篇：一种精密旋盘进给变向传动装置的制作方法