一种更新噪声数据库的机器人语音识别方法及装置与流程

文档序号：11691849阅读：280来源：国知局

本发明涉及智能机器人领域，尤其涉及一种更新噪声数据库的机器人语音识别方法及装置。

背景技术：

随着语音识别技术的迅速发展，其应用领域也及其广泛。特别是在智能机器人领域，为了使机器人更贴合用户需求、方便用户的使用，将语音识别技术作为智能机器人中人机交互的首选手段。但是，在进行语音识别的过程中，仍然存在着识别效率低的问题。特别是针对家用机器人，其使用环境因用户的不同而有所不同，在不同的使用环境下，其面临的噪声也不同。因此，如何在不同用户环境下对不同的噪声进行有效的处理，并提高语音识别的效率，成为目前亟待解决的问题。

技术实现要素：

鉴于上述问题，本申请记载了一种更新噪声数据库的机器人语音识别方法，所述方法包括步骤：

获取用户发出的目标语音信号；

将所述目标语音信号分别传递至服务器中的服务器识别单元以及在所述机器人中的机器人识别单元；

所述服务器识别单元对所述目标语音信号进行识别处理以获取服务器识别结果；

所述机器人识别单元对所述目标语音信号进行识别处理以获取机器人识别结果；

其中，所述方法还包括步骤：

基于所述服务器识别结果和/或所述机器人识别结果以获取最终识别结果，所述机器人根据所述最终识别结果启动相应的功能模块；

于所述功能模块需要所述目标语音信号中的语音数据时，分别获取所述服务器识别结果和所述机器人识别结果的语音相似度，并根据所述语音相似度从所述服务器识别结果或所述机器人识别结果中获取所述语音数据；

在获取所述目标语音信号之后以及将所述目标语音信号分别传递至所述服务器识别单元和所述机器人识别单元之前，所述方法还包括步骤：

判断所述目标语音信号中是否全部为噪声；

若所述目标语音信号中仅存在所述噪声，根据所述目标语音信号更新噪声数据库并不再进行识别处理；

若所述目标语音信号中不只存在所述噪声，在所述噪声数据库中选择对所述噪声进行降噪处理的噪声数据，并根据所述噪声数据对所述目标语音信号进行降噪处理后将所述目标语音信号分别传送至所述服务器识别单元以及所述机器人识别单元中；

其中，根据所述目标语音信号更新所述噪声数据库的过程包括步骤：

将所述目标语音信号与所述噪声数据库中的所有噪声数据进行比对以获取所有的噪声相似度；

与噪声阈值进行比较，判断是否所有的噪声相似度均小于所述噪声阈值；

若均小于，将所述目标语音信号存储至所述噪声数据库中；

否则，不做任何处理。

较佳的，所述方法还包括：

当所述功能模块不需要所述语音数据时，将所述服务器识别结果输入至所述功能模块以控制所述机器人完成相应的功能。

较佳的，所述获取服务器识别结果的过程包括：

将请求获取所述服务器识别结果的服务器请求信号发送至所述服务器中；以及

根据所述服务器请求信号，从所述服务器识别单元中接收所述服务器识别数据。

较佳的，所述方法还包括步骤：

测试获取所述服务器和所述机器人之间的网络通信状态；

若所述网络通信状态低于正常水平，则所述功能模块从所述机器人识别单元中获取所述计算机识别数据中的所述语音数据；

若所述网络通信状态处于或高于正常水平，则执行步骤分别获取所述服务器识别结果和所述机器人识别结果的语音相似度。

较佳的，所述方法进一步包括：

将从所述服务器识别结果或所述机器人识别结果中获取所述语音数据传送至所述功能模块中。

较佳的，获取所述机器人识别结果的过程包括步骤：

所述机器人识别单元参考获取所述服务器识别单元识别所述目标语音信号的数据库以对所述目标语音信号进行识别处理。

本发明还提供了一种更新噪声数据库的机器人语音识别装置，适用于上述提出的更新噪声数据库的机器人语音识别方法。

上述技术方案具有如下优点或有益效果：本发明提出的更新噪声数据库的机器人语音识别方法及装置，在通过相互补充的服务器识别单元和机器人识别单元的共同处理下而获取最终识别结果的过程中，通过预定的算法选择和使用具有高可靠性的语音识别结果作为最终识别结果，从而增强机器人的语音识别率。除此之外，为了保证数据信息的安全性，当在语音识别后所启动的功能模块需要语音数据时，可以选择使用机器人识别单元获取的机器人识别结果，来防止与语音数据相关联的服务器识别结果在网络传输中泄漏。最后，在网络通信状态出现故障或信号不佳期间，能够自动忽略服务器识别结果，从而消除从处理单元接收服务器识别结果所需要的延迟，进而提高了识别效率。最后，在获取目标语音信号之后，首先进行去噪处理，以提高识别准确率。另外，对于全部是噪声的信号，将其判断后添加至噪声数据库中，以丰富噪声数据，有利于提高后续识别过程中对信号的去噪效率。

附图说明

参考所附附图，以更加充分的描述本发明的实施例。然而，所附附图仅用于说明和阐述，并不构成对本发明范围的限制。

图1为本发明中更新噪声数据库的机器人语音识别方法的流程图；

图2为本发明中根据网络通信状态确定是否选择服务器识别结果的流程示意图；

图3为本发明中服务器是否对目标语音信号进行处理的流程示意图；

图4为本发明中对目标语音信号进行更新去噪处理的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是本实施例中机器人语音识别系统进行语音识别方法的流程图。如图1所示，通过麦克风获取用户的目标语音信号(步骤s11)。

接下来，执行将接收到的语音提供给服务器识别单元和机器人识别单元的处理(步骤s12)。麦克风通过传送单元将目标语音信号发送到服务器中，并且由服务器识别单元对该信号进行识别处理(步骤s13)；同时机器人识别单元对该信号进行识别处理(步骤s14)。但是在该过程中，网络通信状态会影响传输速率，所以在实际应用中可以根据网络通信状态阻止到服务器的语音传输。具体来说，若网络通信状态低于整成水平时，则不再将目标语音信号发送至服务器，仅将该目标语音信号传送至机器人识别单元中进行识别处理。

然后，执行通过服务器识别单元识别目标语音信号以获取服务器识别结果(步骤s13)。在该过程中，处理单元可以从服务器中获取服务器识别结果。这时，对网络通信状态进行判断，以确定是否需要阻止来自于服务器的服务器识别结果。此外，执行通过机器人识别单元识别目标语音信号以获取获取机器人识别结果。

在识别处理之后，执行基于服务器识别结果和/或机器人识别结果(即两者中的至少一个)来启动与用户的意图相对应的功能模块(步骤s15)。例如，在实际应用中，通过口语理解(slu)工作可以估计与用户的意图相对应的功能(每个功能模块对应不同的功能)。slu工作指的是从语音识别的句子中提取有意义的信息以推断用户的意图，主要是，提取诸如主要行为、言语动作、所命名的实体等的信息。在此，主要动作表示在用户的说话中透露的用户想要采取的特定行为，并且言语动作表示诸如人、地点、组织、时间等的关键字信息。

接下来，判断功能模块是否需要目标语言信号中的语音数据(步骤s16)(语音数据可以代表具体信息或动作信息，如天气信息或启动窗帘、热水器等动作)。例如，当用户发出的目标语音信号需要获知今天的天气状况时，这是需要计算服务器识别结果和机器人识别结果的语音相似度。这里，语音相似度能够表示在相互比较的文本内多个字符或者单词彼此一致的比率。例如，当“1234”与“1236”相比较时，四个字符中的三个相同但是一个是不同的，因此这两组数字的语音相似度可以被计算为75％。

执行将计算的语音相似度与语音阈值进行比较的处理(步骤s17)，并将语音相似度与语音阈值的大小进行比较(步骤s18)。当语音相似度小于语音阈值时，即服务器识别结果和机器人识别结果之间存在大的差异，这时从服务器识别结果和机器人识别结果中选择服务器识别结果进行进一步处理(步骤s19)。简言之，此时选择服务器识别结果用于控制相应的功能模块。

但是，当语音相似度等于或者大于语音阈值时，即服务器识别结果和机器人识别结果中存在小的差异，那么此时从服务器识别结果和机器人识别结果中选择机器人识别结果进行进一步处理(步骤s20)。简言之，此时选择机器人识别结果用于控制相应的功能模块。

另外，当估计的功能不需要语音数据时执行忽略机器人识别结果的处理(步骤s21)。因此，服务器识别结果可以被用于执行所估计的功能。

因此，在本实施例中，通过相互补充服务器识别单元和机器人识别单元获得的语音识别结果中，通过预定的算法选择和使用两者中具有高可靠性的语音识别结果，从而增强机器人的语音识别效率。

另外，在本实施例中，如果在语音识别处理期间所对应启动的功能模块需要目标语音信号中的语音数据时，优选的，选择机器人识别结果作为处理对象，从而防止与语音数据相关联的服务器识别结果在网络传输中泄漏。

除此之外，能够在网络通信状态不良期间忽略服务器识别单元处理后的语音识别结果，以消除从处理单元接收服务器识别结果所需要的延迟，从而增强语音识别的处理速度。

图2是本实施例中根据网络通信状态确定是否选择服务器识别结果的流程示意图，图3是本实施例中服务器是否对目标语音信号进行处理的流程示意图。

如图2所示，首先，要获得服务器和机器人之间的网络通信状态(步骤s110)。在实际应用中，可以基于传输速度、数据分组损失率等获得网络通信状态。然后，对网络通信状态是否较差进行判定(步骤s120)，如果差，则阻止处理单元从服务器中接收数据服务器识别结果(步骤s130)。

如图3所示，在将对于服务器识别结果的服务器请求信号发送到服务器后(步骤s210)，用以从服务器接收服务器识别结果。

具体来说，首先要确定在预定的响应时间内是否接收到服务器识别结果(步骤s220)。若没有，则说明超时，那么此时取消数据服务器请求，即取消从服务器中获取服务器识别结果的请求(步骤s230)。此时服务器终止服务器识别结果的生成和传输。

图4是本实施例中，对目标语音信号进行去噪处理的流程示意图。具体来说，在获取目标语音信号之后以及将目标语音信号分别传递至服务器识别单元和机器人识别单元之前，需要进行去噪处理。首先，要对目标语音信号中是全部为噪声进行判断(步骤s310)，若目标语音信号中仅存在噪声，根据目标语音信号更新噪声数据库并不再进行识别处理(步骤s320)；若目标语音信号中不只存在噪声，在噪声数据库中选择对噪声进行降噪处理的噪声数据，并根据噪声数据对目标语音信号进行降噪处理后将目标语音信号分别传送至数据服务器识别单元以及机器人识别单元中。即如果目标语音信号中仅存在噪声，那么说明该目标语音信号无意义，则不需要对其继续进行识别处理；如果目标语音信号中不止存在噪声，那么就需要对其中的噪声进行去噪处理，以提高识别的准确性。

图4中给出了本实施例中更新噪声数据库的流程示意图。如果目标语音信号中仅存在噪声，那么首先将目标语音信号与噪声数据库中的所有噪声数据进行比对以获取所有的噪声相似度(步骤s330)，然后将该噪声相似度与噪声阈值进行比较，以判断是否所有的噪声相似度均小于噪声阈值(步骤s340)。当所有噪声相似度小于噪声阈值时，将目标语音信号存储至噪声数据库中(步骤s350)。即如果目标语音信号与噪声数据库中的噪声数据的相关性均较小，则说明目标语音信号所代表的噪声数据并不存在于噪声数据库中，因此将其添加至噪声数据库中，以丰富噪声数据库的噪声数据，从而提高后续的噪声处理精准度。

在本实施例中，机器人识别单元可以参考服务器数据库识别接收到的语音，在该服务器数据库中以语音数据指定信息域，并且机器人识别单元可以将语音识别结果传输到控制模块。控制模块可以基于处理单元的最终识别结果来估计和执行与用户的意图相对应的功能模块。例如，当麦克风到从用户接收到的目标语音信号为“打开电视机”时，控制模块可以执行相应的开启电视机的功能模块。

此外，本实施例还提供了一种更新噪声数据库的机器人语音识别装置，所述装置适用于上述提出的更新噪声数据库的机器人语音识别方法。

本实施例提出的更新噪声数据库的机器人语音识别方法及装置，在通过相互补充的服务器识别单元和机器人识别单元的共同处理下而获取最终识别结果的过程中，通过预定的算法选择和使用具有高可靠性的语音识别结果作为最终识别结果，从而增强机器人的语音识别率。

除此之外，为了保证数据信息的安全性，当在语音识别后所启动的功能模块需要语音数据时，可以选择使用机器人识别单元获取的机器人识别结果，来防止与语音数据相关联的服务器识别结果在网络传输中泄漏。

最后，在网络通信状态出现故障或信号不佳期间，能够自动忽略服务器识别结果，从而消除从处理单元接收服务器识别结果所需要的延迟，进而提高了识别效率。

根据上述实施例的配置和方法将不会以有限的方式应用于前述的机器人，并且每个实施例的全部或者部分可以被选择性地组合，并且被配置成对其进行各种修改。

对于本领域的技术人员而言，阅读上述说明后，各种变化和修正无疑将显而易见。因此，所附的权利要求书应看作是涵盖本发明的真实意图和范围的全部变化和修正。在权利要求书范围内任何和所有等价的范围与内容，都应认为仍属本发明的意图和范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：祝铭明
技术所有人：芋头科技（杭州）有限公司
我是此专利的发明人