一种语音识别的方法、终端及存储介质与流程

文档序号：11232708阅读：767来源：国知局

本发明涉及终端领域，尤其涉及一种语音识别的方法、终端及存储介质。

背景技术：

目前，随着科学技术的发展，也带动人类的物质生活极大丰富，智能终端也变得普及。

人们可以通过智能终端进行工作、娱乐以及游戏。具体的，目前存在一个场景，当儿童独自一人时，容易发生突发状况，而此时儿童又很难应对；此时，如何通过终端确定儿童的状态并向家长进行告警显得尤为重要。

技术实现要素：

本发明实施例公开了一种语音识别的方法及终端，将从儿童哭声中提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否为目标儿童的声纹；当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警。通过本发明提供的技术方案，能够及时确定儿童的状态并向家长进行告警。

本发明实施例第一方面公开一种语音识别的方法，所述方法包括：

当检测到儿童的哭声时，对所述哭声进行声纹提取；

将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；

当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警。

本发明第二方面公开了一种终端，所述终端包括：

提取单元，用于当检测到儿童的哭声时，对所述哭声进行声纹提取；

匹配单元，用于将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；

告警单元，用于当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警。

本发明第三方面公开了一种终端，所述终端包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明第一方面中任一项所述的方法。

本发明第四方面公开了一种计算机可读存储介质，其存储用于电子数据交换的计算机程序，其中，所述计算机程序使得计算机执行如本发明第一方面任一项所述的方法。

本发明第五方面公开了一种移动终端，所述移动终端包括通用处理器，所述通用处理器用于：

当检测到儿童的哭声时，对所述哭声进行声纹提取；

将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；

当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警。

与现有技术相比，本发明实施例具有以下有益效果：

本发明实施例中，将从儿童哭声中提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警。通过本发明提供的技术方案，能够及时确定儿童的状态并向家长进行告警。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种语音识别的方法的流程示意图；

图2是本发明实施例公开的另一种语音识别的方法的流程示意图；

图3是本发明实施例公开的另一种语音识别的方法的流程示意图；

图4是本发明实施例公开的一种用户终端的结构示意图；

图5是本发明实施例公开的另一种用户终端的结构示意图；

图6是本发明实施例公开的另一种用户终端的结构示意图；

图7是本发明实施例公开的一种用户终端的物理结构示意图；

图8是本发明实施例公开的另一种用户终端的物理结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开了一种语音识别的方法及终端，能够通过儿童的哭声和声纹模型及时确定儿童的状态并向家长进行告警。

以下分别进行详细说明。

请参阅图1，图1是本发明实施例公开的一种语音识别的方法的流程示意图。该语音识别的方法可以包括以下步骤。

s101、当检测到儿童的哭声时，对所述哭声进行声纹提取；

本发明实施例中，方法的执行主体是终端，该终端可以包括移动手机、平板电脑、个人数字助理(personaldigitalassistant，pda)、移动互联网设备(mobileinternetdevice，mid)等各类终端，本发明实施例不作限定。

需要指出的是，可选的，终端对周围环境中的声音进行周期性检测；对检测到的声音进行去噪；对去噪后的声音进行音调分析以确定检测到的声音是为否儿童的哭声。

具体的，对周围环境中的声音进行周期性检测，其中，检测的周期可以是终端默认的，也可以是用户输入的，还可以时根据终端电池的剩余电量确定的。

举例来说，当终端剩余电量大于80％时，可以每个30s检测一次，当终端剩余电量大于30％且小于80％时，每个两分钟检测一次；当终端剩余电量小于30％时，可以每个10分钟检测一次。当终端电池的剩余电量小于10％时，可以停止该周期性检测功能。

需要指出的是，该终端包括声音传感器，通过声音传感器获取周围的声音。可选的，终端还可以通过麦克风进行声音的收集。

s102、将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；

具体的，所述将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹之前，所述方法还包括：获取录制的所述目标儿童的声音；对所述获取的声音进行声纹提取；利用预设机器学习算法对提取的声纹进行训练以获取所述目标儿童的声纹模型。其中，常见的预设机器学习算法包括分类算法、贝叶斯算法、监督学习算法等等。

可以理解的是，终端可以录制儿童平时说话的声音，然后从录制的声音中提取声纹，利用机器学习算法对提取的声纹进行训练以获取声纹模型。

s103、当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警。

其中，需要指出的是，预设通信方式可以是语音、震动、文字提示等。

另外，可选的，所述通过预设通信方式向家长进行告警之后，所述方法还包括：

通过预设声音对所述目标儿童进行原因问询；接收所述目标儿童反馈的信息；对所述反馈的信息进行分析以确定事件类型；当所述事件类型为身体受伤时，根据所述目标儿童的位置确定预设范围内救治中心的联系方式，并通过所述联系方式向所述救治中心进行告警。

具体的，预设声音可以是模仿妈妈的声音。比如提前录制妈妈的声音，然后模仿妈妈的音色确定询问的语句，并将询问的语句进行存储。

儿童可以通过语音的方式进行信息反馈，还可以通过终端上的快捷键进行信息反馈。比如1快捷键表示摔倒了，2快捷键表示迷路了，3快捷键标识饿了，4快捷键标识受伤了等等。

可以理解的是，当事件类型为紧急类型时，通过卫星定位系统确定儿童当前的位置，并向监护人的终端发送该位置信息。常见的紧急类型是受伤、迷路等。

可选的，当所述事件类型为人事纠纷时，通过摄像头对周围环境进行拍摄；向安保服务器发送拍摄的图片以及所述目标儿童的位置信息。

需要指出的是，常见的人事纠纷包括打架、辱骂等等。

可以理解的是，当所述事件类型为人事纠纷时，终端会主动启动摄像头以对周围环境进行拍摄；并向安保服务器发送拍摄的图片以及所述目标儿童的位置信息。其中，安保服务器可以是公安局的服务器。

从上可知，本发明实施例提供了一种技术方案，将从儿童哭声中提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警。通过本发明提供的技术方案，能够及时确定儿童的状态并向家长进行告警。

请参阅图2，图2是本发明实施例公开的一种语音识别的方法的流程示意图。如图2所示，该语音识别的方法可以包括以下步骤。

s201、对周围环境中的声音进行周期性检测；

本发明实施例中，执行的主体可以是终端。终端可以包括移动手机、平板电脑、个人数字助理(personaldigitalassistant，pda)、移动互联网设备(mobileinternetdevice，mid)等各类终端，本发明实施例不作限定。

s202、对检测到的声音进行去噪；

s203、对去噪后的声音进行音调分析以确定检测到的声音是为否儿童的哭声；

s204、当检测到儿童的哭声时，对所述哭声进行声纹提取；

s205、将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；

s206、当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警；

s207、通过预设声音对所述目标儿童进行原因问询；

s208、接收所述目标儿童反馈的信息；并对所述反馈的信息进行分析以确定事件类型；

s209、当所述事件类型为身体受伤时，根据所述目标儿童的位置确定预设范围内救治中心的联系方式，并通过所述联系方式向所述救治中心进行告警。

s210、当所述事件类型为人事纠纷时，通过摄像头对周围环境进行拍摄；并向安保服务器发送拍摄的图片以及所述目标儿童的位置信息。

在图2所描述的方法中，通过预设声音对所述目标儿童进行原因问询；接收所述目标儿童反馈的信息；并对所述反馈的信息进行分析以确定事件类型；当所述事件类型为身体受伤时，根据所述目标儿童的位置确定预设范围内救治中心的联系方式，并通过所述联系方式向所述救治中心进行告警。通过上述技术方案，能够针对身体受伤的事件类型向救治中心进行告警，从而使得儿童能够及时得到救治。

请参阅图3，图3是本发明实施例公开的一种语音识别的方法的流程示意图。如图3所示，该语音识别的方法可以包括以下步骤。

s301、获取录制的目标儿童的声音；并对所述获取的声音进行声纹提取；

s302、利用预设机器学习算法对提取的声纹进行训练以获取所述目标儿童的声纹模型；

s303、对周围环境中的声音进行周期性检测；

s304、对检测到的声音进行去噪；

s305、对去噪后的声音进行音调分析以确定检测到的声音是为否儿童的哭声；

s306、当检测到儿童的哭声时，对所述哭声进行声纹提取；

s307、将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；

s308、当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警。

在图3所描述的方法中，能够根据目标儿童的声音和预设机器算法获取声纹模型，以使得终端根据检测到的儿童声音和声纹模型确定是否是目标儿童在哭泣。通过本发明技术方案，能够获取声纹模型以尽快识别检测到的哭声是否为目标儿童的哭声。

请参阅图4，图4是本发明实施例公开的一种终端的结构示意图。在图4所描述的终端中，可以包括：

提取单元401，用于当检测到儿童的哭声时，对所述哭声进行声纹提取；

匹配单元402，用于将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；

告警单元403，用于当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警。

需要指出的是，图4所示的结构可用于执行s101－s103所述的方法。

请一并参阅图5，图5是本发明实施例公开的另一种终端的结构示意图。图5所示的终端还可以包括：

检测单元501，用于对周围环境中的声音进行周期性检测；

去噪单元502，用于对检测到的声音进行去噪；

分析单元503，用于对去噪后的声音进行音调分析以确定检测到的声音是为否儿童的哭声；

提取单元504，用于当检测到儿童的哭声时，对所述哭声进行声纹提取；

匹配单元505，用于将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；

告警单元506，用于当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警；

询问单元507，用于通过预设声音对所述目标儿童进行原因问询；

接收单元508，用于接收所述目标儿童反馈的信息；

分析单元503，用于对所述反馈的信息进行分析以确定事件类型；

确定单元509，用于当所述事件类型为身体受伤时，根据所述目标儿童的位置确定预设范围内救治中心的联系方式；

告警单元506，用于通过所述联系方式向所述救治中心进行告警。

拍摄单元510，用于当所述事件类型为人事纠纷时，通过摄像头对周围环境进行拍摄；

发送单元511，用于向安保服务器发送拍摄的图片以及所述目标儿童的位置信息。

可以理解的是，图5所述的终端可用于执行s201－s210所示的方法。

请一并参阅图6，图6是本发明实施例公开的另一种用户终端的结构示意图。图6所示的终端包括：

获取单元601，用于获取录制的所述目标儿童的声音；

提取单元602，用于对所述获取的声音进行声纹提取；

训练单元603，用于利用预设机器学习算法对提取的声纹进行训练以获取所述目标儿童的声纹模型；

检测单元604，用于对周围环境中的声音进行周期性检测；

去噪单元605，用于对检测到的声音进行去噪；

分析单元606，用于对去噪后的声音进行音调分析以确定检测到的声音是为否儿童的哭声；

提取单元602，用于当检测到儿童的哭声时，对所述哭声进行声纹提取；

匹配单元607，用于将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；

告警单元608，用于当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警。

可以理解的是，图6所述的终端能够执行s301－s308所述的方法。

请参阅图7，图7为本发明实施例公开的又一种终端的结构示意图，如图7所示，该终端可以包括：至少一个处理器710，例如cpu，存储器720，至少一个通信总线730，输入装置740，输出装置750。其中，通信总线730用于实现这些组件之间的通信连接。存储器720可以是高速ram存储器，也可以是非不稳定的存储器(non－volatilememory)，例如至少一个磁盘存储器。存储器720可选的还可以是至少一个位于远离前述处理器710的存储装置。其中，处理器710可以结合图4至图6所描述的终端，存储器720中存储一组程序代码，且处理器710调用存储器720中存储的程序代码，用于执行以下操作：

当检测到儿童的哭声时，对所述哭声进行声纹提取；

将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；

当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警。

可选的，所述操作还包括：

对周围环境中的声音进行周期性检测；

对检测到的声音进行去噪；

对去噪后的声音进行音调分析以确定检测到的声音是为否儿童的哭声。

可选的，所述通过预设通信方式向家长进行告警之后，所述操作还包括：

通过预设声音对所述目标儿童进行原因问询；

接收所述目标儿童反馈的信息；

对所述反馈的信息进行分析以确定事件类型；

当所述事件类型为身体受伤时，根据所述目标儿童的位置确定预设范围内救治中心的联系方式，并通过所述联系方式向所述救治中心进行告警。

可选的，所述操作还包括：

当所述事件类型为人事纠纷时，通过摄像头对周围环境进行拍摄；

向安保服务器发送拍摄的图片以及所述目标儿童的位置信息。

可选的，所述将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹之前，所述操作还包括：

获取录制的所述目标儿童的声音；

对所述获取的声音进行声纹提取；

利用预设机器学习算法对提取的声纹进行训练以获取所述目标儿童的声纹模型。

请参阅图8，图8为本发明实施例公开的又一种移动终端的结构示意图，如图8所示，该移动终端可以包括：基带处理大规模集成电路88(基带处理lsi)，通用处理器820，语音处理集成电路830(语音处理ic)，触摸控制器840，陀螺仪传感器850，通信总线860，存储器870。其中，通信总线860用于实现这些组件之间的通信连接。存储器870可以是高速ram存储器，也可以是非不稳定的存储器(non－volatilememory)，例如至少一个磁盘存储器。其中，通用处理器820可以结合图3至图6所描述的终端，存储器870中存储一组程序代码，且通用处理器820调用存储器870中存储的程序代码，用于执行以下操作：

当检测到儿童的哭声时，对所述哭声进行声纹提取；

将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹；

当确定所述提取的声纹是所述目标儿童的声纹时，通过预设通信方式向家长进行告警。

可选的，所述操作还包括：

对周围环境中的声音进行周期性检测；

对检测到的声音进行去噪；

对去噪后的声音进行音调分析以确定检测到的声音是为否儿童的哭声。

可选的，所述通过预设通信方式向家长进行告警之后，所述操作还包括：

通过预设声音对所述目标儿童进行原因问询；

接收所述目标儿童反馈的信息；

对所述反馈的信息进行分析以确定事件类型；

当所述事件类型为身体受伤时，根据所述目标儿童的位置确定预设范围内救治中心的联系方式，并通过所述联系方式向所述救治中心进行告警。

可选的，所述操作还包括：

当所述事件类型为人事纠纷时，通过摄像头对周围环境进行拍摄；

向安保服务器发送拍摄的图片以及所述目标儿童的位置信息。

可选的，所述将提取的声纹与声纹模型进行匹配以确定所述提取的声纹是否目标儿童的声纹之前，所述操作还包括：

获取录制的所述目标儿童的声音；

对所述获取的声音进行声纹提取；

利用预设机器学习算法对提取的声纹进行训练以获取所述目标儿童的声纹模型。

其中，可选的，所述通用处理器包括应用处理器和人工智能ai模块，所述ai模块集成于所述应用处理器设置，所述ai模块用于：

获取录制的所述目标儿童的声音；对所述获取的声音进行声纹提取；利用预设机器学习算法对提取的声纹进行训练以获取所述目标儿童的声纹模型。

另外，可选的，所述通用处理器包括应用处理器和人工智能ai模块，所述ai模块独立于所述处理器设置，所述ai模块用于：

获取录制的所述目标儿童的声音；对所述获取的声音进行声纹提取；利用预设机器学习算法对提取的声纹进行训练以获取所述目标儿童的声纹模型。

进一步，需要指出的是，ai模块的具体形式可以是硬件和/或软件，ai模块包括硬件形态时，处理器和ai模块可以是集成设置，也可以是分离设置，此处不做限定。

在ai模块集成与所述应用处理器集成设置时，若应用处理器为单核处理器，则ai模块可以是应用处理器中的智能微处理电路，若应用处理器为多核处理器，则ai模块可以是多核处理器中的单个智能微处理器内核或者某一个微处理器内核中的智能微处理电路。

在ai模块集成与所述应用处理器分离设置时，ai模块可以是应用处理器平台架构中除所述应用处理器之外的任意一个协处理器(如基带处理器等)，或者，可以是应用处理器平台架构中除所述应用处理器之外的一个新设置的智能微处理器，或者，可以是新设置的独立于所述应用处理器平台的智能处理平台，且该智能处理平台至少包括一个专用智能处理器，该智能处理平台与应用处理器平台通信连接，可选的，智能处理平台还可以与存储器、外设等直连通信连接。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器(read－onlymemory，rom)、随机存储器(randomaccessmemory，ram)、可编程只读存储器(programmableread－onlymemory，prom)、可擦除可编程只读存储器(erasableprogrammablereadonlymemory，eprom)、一次可编程只读存储器(one－timeprogrammableread－onlymemory，otprom)、电子抹除式可复写只读存储器(electrically－erasableprogrammableread－onlymemory，eeprom)、只读光盘(compactdiscread－onlymemory，cd－rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上对本发明实施例公开的一种基于图像的解锁屏方法及用户终端进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：白剑
技术所有人：广东欧珀移动通信有限公司
我是此专利的发明人

上一篇：曲轴动平衡块安装台的制造方法与工艺
上一篇：一种具有同步测试孔隙水压力功能的扁铲侧胀仪的制造方法与工艺