一种本地新增语料的语音处理方法及系统与流程

文档序号：19422438发布日期：2019-12-14 01:42阅读：201来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本申请涉及语音处理技术领域，尤其涉及一种本地新增语料的语音处理方法及系统。

背景技术：

随着技术的发展，车辆中也已经加装了各种高新技术，比如语音控制、智能驾驶等等。

当前，在车辆中都装配了语音控制功能，用户可以通过语音输入的方式来控制车辆上对应的功能，比如用户可以通过语音控制来调节空调的问题，也可以通过语音来拨打电话，甚至可以通过语音来控制车辆的座椅等等。

但是，现在的语音控制中用户需要输入标准的语音信息，若是用户输入非标准的语音信息时，系统将无法识别，从而导致语音控制的局限性以及实用性都较低的问题。

技术实现要素：

本发明提供了一种本地新增语料的语音处理方法及系统，用以解决现有技术中用户输入非标准的语音信息时，系统将无法识别，从而导致语音控制的局限性以及实用性都较低的问题。

其具体的技术方案如下：

一种本地新增预料的语音处理方法，所述方法包括：

获取用户输入的语音信息，并将所述语音信息转换为第一文本信息；

判定所述第一文本信息在本地语料库中是否存在对应语料；

若不存在，则输出提示用户重新输入语音信息的提示信息；

在用户根据所述提示信息重新输入语音信息时，确定重新输入的语音信息对应的第二文本信息；

将所述第二文本信息作为新增语料，存储于动态语料库中。

可选的，将所述第二文本信息作为新增语料，存储于动态语料库中，包括：

将所述第二文本信息与确定出的语料的关联信息进行语音输出；

在收到用户输入对所述关联信息的确定指令时，将所述第二文本信息与确定出的新增语料关联，并在所述动态语料库中添加所述新增语料。

可选的，所述方法还包括：

在所述本地语料库中存在所述第一文本信息对应的语料时，则输出所述语料对应的答案文本；

将所述答案文本通过从文本到语音tts技术转换为语音数据输出。

可选的，所述方法还包括：

在所述本地语料库存在新增语料时，将所述动态语料库与所述本地语料库进行匹配；

在所述动态语料库与所述本地语料库存在重复的语料时，则在所述动态语料库或者所述本地语料库中重复的语料。

可选的，所述方法还包括：

检测所述本地语料库是否处于空闲状态；

在所述本地语料库处于空闲状态时，主动输出语音信号，并接收用户基于所述语音信号的音频信号；

根据所述本地语料库，对所述音频信号进行回复。

一种本地新增预料的语音处理系统，所述系统包括：

获取模块，用于获取用户输入的语音信息，并将所述语音信息转换为第一文本信息；

处理模块，用于判定所述第一文本信息在本地语料库中是否存在对应语料；若不存在，则输出提示用户重新输入语音信息的提示信息；在用户根据所述提示信息重新输入语音信息时，确定重新输入的语音信息对应的第二文本信息；将所述第二文本信息作为新增语料，存储于动态语料库中。

可选的，所述处理模块，具体用于将所述第二文本信息与确定出的语料的关联信息进行语音输出；在收到用户输入对所述关联信息的确定指令时，将所述第二文本信息与确定出的新增语料关联，并在所述动态语料库中添加所述新增语料。

可选的，所述处理模块，还用于在所述本地语料库中存在所述第一文本信息对应的语料时，则输出所述语料对应的答案文本；将所述答案文本通过从文本到语音tts技术转换为语音数据输出。

可选的，所述处理模块，还用于在所述本地语料库存在新增语料时，将所述动态语料库与所述本地语料库进行匹配；在所述动态语料库与所述本地语料库存在重复的语料时，则在所述动态语料库或者所述本地语料库中重复的语料。

可选的，所述处理模块，还用于检测所述本地语料库是否处于空闲状态；在所述本地语料库处于空闲状态时，主动输出语音信号，并接收用户基于所述语音信号的音频信号；根据所述本地语料库，对所述音频信号进行回复。

通过上述的方法，在系统无法通过本地语料库以及动态语料库识别出用户语音对应的语料时，系统将与用户确认，在用户完成确认之后，系统将该语音对应的语料作为新增语料，然后将该新增语料添加到动态语料库中，通过此方式系统可以及时对的无法识别的语音进行自学习并添加到动态语料中，从而使得系统可以实时进行语料更新，提升了系统的适应性，进一步提升了用户的使用体验。

附图说明

图1为本发明实施例中一种本地新增语料的语音处理方法的流程图；

图2为本发明实施例中语音处理流程示意图之一；

图3为本发明实施例中一种本地语料库进行语音回复的流程示意图；

图4为本发明实施例中语音处理流程示意图之二；

图5为本发明实施例中一种本地新增语料的语音处理系统的结构示意图。

具体实施方式

下面通过附图以及具体实施例对本发明技术方案做详细的说明，应当理解，本发明实施例以及实施例中的具体技术特征只是对本发明技术方案的说明，而不是限定，在不冲突的情况下，本发明实施例以及实施例中的具体技术特征可以相互组合。

如图1所示为本发明实施例中一种本地新增语料的语音处理方法的流程图，该方法包括：

s1，获取用户输入的语音信息，并将所述语音信息转换为第一文本信息；

s2，判定所述第一文本信息在本地语料库中是否存在对应语料；

若是在本地语料库中不存在对应的语料时，则跳转至执行步骤s3-s5，若是在本地语料库中存在该语料时，则跳转至执行步骤s6-s7。

s3，输出提示用户重新输入语音信息的提示信息；

s4，在用户根据所述提示信息重新输入语音信息时，确定重新输入的语音信息对应的第二文本信息；

s5，将所述第二文本信息作为新增语料，存储于动态语料库中；

s6，输出所述语料对应的答案文本；

s7，将所述答案文本通过从文本到语音tts技术转换为语音数据输出。

下面通过具体的场景来对本发明技术方案做更加全面以及详细的说明：

在上述的方法中，系统中存在两个语料对比库，其中一个为动态语料库，另外一个为本地语料库，在本发明实施例中动态语料库可以为自然语言处理域nlp1，本地语料库可以为自然语言处理域nlp2。

举例来讲，如图2所示为一种本地语料库进行语音回复的流程示意图，在图2中首先获取到用户的语音信息，然后通过asr将语音信息转换为文本信息，通过仲裁器对文本信息进行吻合度判断，若是吻合度大于0.95，则通过本地nlp来进行语料匹配，若是匹配成功，则成功输出答案文本至tts答案，若是本地nlp匹配失败，则提供答案失败，并输出tts理解失败，然后通过增量学习引擎进行语料学习，并判断是否进行语料新增，若是，则在动态语料库中增加新的语料，若否，则结束流程。

举例来讲，如图3所示，获取到用户的语音信息之后，将该语音信息转变为文本信息“打开冷气”，此时在本地语料库中存在该语料，因此在经过asr得到文本信息之后，系统得到该文本信息与本地语料库之间的匹配度达到0.95，此时将根据本地语料库得到对应tts答案，并完成输出。

进一步，如图2所示为一种动态语料库进行语音回复的流程示意图，在图2中首先获取到用户的语音信息，然后将该语音信息转变为文本信息“打开空调”，此时在动态语料库中存在该语料，因此在经过asr得到文本信息之后，系统得到该文本信息与动态语料库之间的匹配度达到0.95，此时将根据动态语料库得到对应tts答案，并完成输出。

通过上述的两种的方法在获取到用户的语音信息之后，可以根据与动态语料库以及本地语料库之间的匹配度来确定使用对应的语料来进行回复，从而实现了不同语音信息的准确识别，提升了语音系统的实用性。

进一步，在本发明实施例中，在执行匹配之前，首先是需要实时对语料表以及语料库进行更新，具体来讲，在获取到用户语音信息对应的第一文本信息之后，判定第一文本信息在动态语料库以及本地语料库中是否存在对应语料，若不存在，则输出提示用户重新输入语音信息的提示信息；在用户根据所述提示信息重新输入语音信息时，确定重新输入的语音信息对应的第二文本信息；判定所述第二文本信息在所述动态语料库以及本地语料库中是否存在对应语料；若存在，则将所述第二文本信息与确定出的语料关联，并在所述动态语料库中新增语料。

举例来讲，如图4所示，在图4中首先获取用户语音，通过asr确定语音信息对应的文本信息，然后对比判断是否存在对应语料，若是无对应语料，则请求用户重讲，在用户换种说法重讲之后，系统将再次通过asr识别结果，并再次进行对比判断，若是找到对应语料，则执行指令，并关联听不懂的问题，然后进行新增语料确认，在用户进行语音确认后，完成新增语料，并添加到对应的语料库或者语料表中。

下面通过具体的应用场景来对本发明技术方案进一步说明。

1、车主对车载机器人发出语音指令：打开冷气；

2、车载机器人在动态语料库中找不到“打开冷气”关键词，回复：这个我不太懂，能否换种说法试试；

3、车主进行确定，发出语音指令：打开空调；

4、车载机器人执行指令并关联没听懂的语料，进行新增语料的确认：打开冷气是不是打开空调的意思；

5、车主给予预测问题的回复，如：是的/对；

6、车载机器人回复：好的，我学会了，打开冷气是打开空调的意思；

7、车主再次发出语音指令：打开冷气。已经新增到本地nlp动态语料库，根据语音指令执行任务并答复：已经为您打开空调；

8、车机端提供新增语料的列表，用户可以进行新增语料对应功能的删、查、改。

通过上述的方法可以实时对语料表以及语料库进行更新，从而保证语料表以及语料库中的语料满足实时的准确性。

进一步，在本发明实施例中，在本地语料库存在新增语料时，将动态语料库与所述本地语料库进行匹配；在动态语料库与本地语料库存在重复的语料时，则在动态语料库或者本地语料库中重复的语料。通过该匹配的过程，可以及时的避免语料表与语料库中的语料重合，提升了确定语料的准确性。

进一步，在本发明实施例中，为了提升用户的使用体验，系统将实时的检测所述本地语料库是否处于空闲状态；在所述本地语料库处于空闲状态时，主动输出语音信号，并接收用户基于所述语音信号的音频信号；根据所述本地语料库，对所述音频信号进行回复。

对应本发明实施例所提供的方法，本发明实施例中还提供了一种系统，如图5所示为本发明实施例中一种本地新增预料的语音处理系统的结构示意图，该系统包括：

获取模块501，用于获取用户输入的语音信息，并将所述语音信息转换为第一文本信息；

处理模块502，用于判定所述第一文本信息在本地语料库中是否存在对应语料；若不存在，则输出提示用户重新输入语音信息的提示信息；在用户根据所述提示信息重新输入语音信息时，确定重新输入的语音信息对应的第二文本信息；将所述第二文本信息作为新增语料，存储于动态语料库中。

进一步，在本发明实施例中，所述处理模块502，具体用于将所述第二文本信息与确定出的语料的关联信息进行语音输出；在收到用户输入对所述关联信息的确定指令时，将所述第二文本信息与确定出的新增语料关联，并在所述动态语料库中添加所述新增语料。

进一步，在本发明实施例中，所述处理模块502，还用于在所述本地语料库中存在所述第一文本信息对应的语料时，则输出所述语料对应的答案文本；将所述答案文本通过从文本到语音tts技术转换为语音数据输出。

进一步，在本发明实施例中，所述处理模块502，还用于在所述本地语料库存在新增语料时，将所述动态语料库与所述本地语料库进行匹配；在所述动态语料库与所述本地语料库存在重复的语料时，则在所述动态语料库或者所述本地语料库中重复的语料。

进一步，在本发明实施例中，所述处理模块502，还用于检测所述本地语料库是否处于空闲状态；在所述本地语料库处于空闲状态时，主动输出语音信号，并接收用户基于所述语音信号的音频信号；根据所述本地语料库，对所述音频信号进行回复。

尽管已描述了本申请的优选实施例，但本领域内的普通技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改，包括采用特定符号、标记确定顶点等变更方式。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：韩子天;李立标
技术所有人：安信通科技(澳门)有限公司
我是此专利的发明人

上一篇：深海漂浮式抽水蓄能风力发电装置及方法与流程
上一篇：一种分布式新能源配电网用新能源转换装置的制作方法