一种儿童看护型机器人及辨识儿童哭声的方法

文档序号：10654557阅读：313来源：国知局

一种儿童看护型机器人及辨识儿童哭声的方法
【专利摘要】本发明提供一种儿童看护型机器人，包括主控模块、儿童哭声识别模块和信号收发模块，主控模块，收到儿童哭声识别模块发来的儿童正在哭闹信息的相应信号后，控制信号收发模块发送信息；儿童哭声识别模块，与主控模块连接，包括音频采集模块、音频处理模块和音频判断模块，主控模块根据音频判断模块发送的信息，控制信号收发模块发出相应的提示信号。信号收发模块，与主控模块连接，根据主控模块接收到儿童正在哭闹的信号后，发送提示信号给预设APP的移动终端。本发明能及时向监护人或看护人通知被看护儿童的情况，统计和分析儿童哭闹的原因，模拟监护人声音播放音频来安抚儿童，还能完成监护人与儿童的远程交互。
【专利说明】
一种儿童看护型机器人及辨识儿童哭声的方法
技术领域
[0001]本发明涉及音频处理领域，特别涉及一种儿童看护型机器人及辨识儿童哭声的方法。
【背景技术】
[0002]目前的儿童机器人，基本都是完成人机交互(基本问答，儿歌，故事)，自动充电，自动蔽障等，也有的基本实现了远程监控和视频对话等基本功能。但是还有很多时间盲区没有覆盖到。还有很多功能待完善。目前市面上的儿童机器人，基本还处于人机交互初级阶段，还没有进入人工智能阶段。
[0003]由于孩子的监护人一一父母基本要上班，后续的看护工作就交给保姆或者家中老人等看护者，孩子哭的时候，我们需要知道孩子是为何而哭，是疼痛哭还是非疼痛哭，非疼痛哭是由于饥饿，困乏还是其他不舒服，如:大小便在尿不湿。
[0004]看护者有时候需要做家务，或者在儿童睡着时候，进行其他家务的处理。不能时刻盯着儿童。总有一些时间窗脱离我们的视线(时间盲区)。在时间盲区内，我们也不可能一直盯着手机上的app。需要以事件为驱动来提醒我们。
[0005]另外，监护人忙碌一天后，基本比较疲劳，而儿童通常闹着让爸爸妈妈讲故事。目前市面上的机器人，都是固定的一种声音，都是现成的声音和语调，孩子不爱听。

【发明内容】

[0006]为解决上述技术问题，一种儿童看护型机器人，包括主控模块、儿童哭声识别模块和信号收发模块，
主控模块，收到儿童哭声识别模块发来的儿童正在哭闹信息的相应信号后，控制信号收发模块发送信息；
儿童哭声识别模块，与主控模块连接，包括音频采集模块、音频处理模块和音频判断模块，其中音频采集模块实时采集特定区域的音频信息；音频处理模块将采集到的音频信息进行FFT变换，统计得到的基频频率和能量波形;音频判断模块，根据得到的基频频率和能量波形，判断所述音频是否为哭声;在判断为哭声的音频后，进一步的根据基频频率和能量最大值判断疼痛性哭声和非疼痛性哭声，主控模块根据音频判断模块发送的信息，控制信号收发模块发出相应的提示信号。
[0007]信号收发模块，与主控模块连接，根据主控模块接收到儿童正在哭闹的信号后，发送提示信号给预设APP的移动终端。
[0008]进一步的，所述非疼痛性哭声，进一步的将其中能量均匀的音频，判断为饥饿哭声;能量均匀且每帧能量都低于饥饿哭声的音频判断为困乏哭声。
[0009]进一步的，还包括图像模块，与主控模块连接，包括图像采集模块和图像存储模块，图像采集模块采集儿童及其周围图像信息，当主控模块收到音频判断模块发送的哭声信息时，启动图像采集模块，将采集的图像信息转入图像存储模块，并通过信号收发模块向预设APP的移动终端发送实时图像或视频。
[0010]进一步的，还包括人声交互模块，与主控模块连接，包括人声采集模块、人声处理模块、声音存储模块和播放模块，人声采集模块用于采集监护人的声源，人声处理模块去除声源噪音，将声源存储至声音存储模块，播放模块能调取存储模块中的声源播放，主控模块收到音频判断模块发送的哭声信息时，启动人声交互模块播放声音存储模块中的监护人声
■~>V.曰O
[0011 ]进一步的，所述人声交互模块，还包括人声模拟模块，所述人声模拟模块提取声音存储模块中的音源，合成模拟监护人声音，通过播放模块向儿童播放。
[0012]进一步的，还有一与所述机器人信号收发模块通讯连接的远程服务器，所述远程服务器与若干机器人通讯连接，所述远程服务器收集并处理各机器人采集的哭声数据，得到用于判断疼痛性哭声的基频频率和能量最大值的平均值，并反馈给各机器人调整其判断阀值。
[0013]—种辨识儿童哭声的方法，具体步骤如下，
1)通过音频采集模块实时采集特定区域的音频信息；
2)音频处理模块将采集到的音频信息进行FFT变换，统计得到的基频频率和能量波形；
3)音频判断模块，根据基频频率和能量波形，判断所述音频是否为哭声；
4)音频判断模块，在判断为哭声的音频后，进一步的将基频频率和能量最大值大于阀值的音频判断为疼痛性哭声；
5)基频频率最大值小于阀值且波形平稳的哭声音频判断为饥饿性哭声;波形平稳且每帧能量低于饥饿性哭声的哭声音频判断为困乏性哭声。
[0014]本发明以事件为驱动，在时间盲区内，在孩子的状态发生变化的时候，包含哭声以及其他肢体运动，给我们预设APP的移动端发出提醒，让监护人或者看护者及时处理。
[0015]同时，针对孩子的哭声，是我们监护人非常关注的。对孩子的哭声进行及时提醒并对可能造成哭闹的原因进行分析。
[0016]能提取妈妈和爸爸的语音特征，采用语音合成功能，把相应的内容进行合成器的播放，以满足孩子的监护人声音的需求。
【附图说明】
[0017]图1是本发明所述一种儿童看护型机器人的结构框图；
图2是本发明所述一种儿童看护型机器人的工作流程图；
图3是本发明所述一种辨识儿童哭声的方法的流程图。
【具体实施方式】
[0018]下面结合附图详细阐述本发明技术内容，如图1、图2所示，本发明提供一种儿童看护型机器人，包括主控模块、儿童哭声识别模块和信号收发模块，
主控模块，收到儿童哭声识别模块发来的儿童正在哭闹信息的相应信号后，控制信号收发模块发送信息；
儿童哭声识别模块，与主控模块连接，包括音频采集模块、音频处理模块和音频判断模块，其中音频采集模块实时采集特定区域的音频信息；音频处理模块将采集到的音频信息进行FFT变换，统计得到的基频频率和能量波形;音频判断模块，根据得到的基频频率和能量波形，判断所述音频是否为哭声;在判断为哭声的音频后，进一步的根据基频频率最大值判断疼痛性哭声和非疼痛性哭声，主控模块根据音频判断模块发送的信息，控制信号收发模块发出相应的提示信号。
[0019]根据实验音频数据，我们一般将基频频率连续高于IkHz以上的音频，判断所述音频为哭声;在判断为哭声的音频后，进一步的将基频频率最大值大于5kHz的音频判断为疼痛性哭声;基频频率最大值小于5kHz的判断为非疼痛性哭声，主控模块根据音频判断模块发送的信息，控制信号收发模块发出相应的提示信号。
[0020]信号收发模块，与主控模块连接，根据主控模块接收到儿童正在哭闹的信号后，发送提示信号给预设APP的移动终端。
[0021]所述的预设APP的移动终端可以是手机、平板电脑、移动电脑、可佩带移动终端等任何能接收无线信号的移动终端。
[0022]所述相应的提示信号，可以根据哭声的判断给出短信、震动、警报等提示方式。
[0023]进一步的，所述非疼痛性哭声，进一步的将其中能量均匀的音频，判断为饥饿哭声;能量均匀且每帧能量都低于饥饿哭声的音频判断为困乏哭声。
[0024]在实验中，一般认为所述基频频率最大值小于5kHz的哭声判断为非疼痛性哭声。
[0025]进一步的，还包括图像模块，与主控模块连接，包括图像采集模块和图像存储模块，图像采集模块采集儿童及其周围图像信息，当主控模块收到音频判断模块发送的哭声信息时，启动图像采集模块，将采集的图像信息转入图像存储模块，并通过信号收发模块向预设APP的移动终端发送实时图像或视频。
[0026]进一步的，监护人所在的移动终端也能向机器人发出指令，启动图像模块，主动采集实时图像或视频发送至移动终端。
[0027]进一步的，还包括人声交互模块，与主控模块连接，包括人声采集模块、人声处理模块、声音存储模块和播放模块，人声采集模块用于采集监护人的声源，人声处理模块去除声源噪音，将声源存储至存储模块，播放模块能调取存储模块中的声源播放，主控模块收到音频判断模块发送的哭声信息时，启动人声交互模块播放存储模块中的监护人声音。
[0028]进一步的，监护人也能在的移动终端录制音频发送至机器人，由机器人播放，实现监护人与儿童的交互。
[0029]进一步的，所述人声交互模块，还包括人声模拟模块，所述人声模拟模块提取声音存储模块中的音源，合成模拟监护人声音，通过播放模块向儿童播放。人声模拟模块提取存储模块中的嗓音源、基频，共振峰，强度，音高，时长信息，通过共振峰合成、线性参数合成法、基音同步叠加法或对数振幅近似模型对语音进行合成，合成的方式可以直接由文字转换为声音输出，也可以把相关的声音通过其他软件转换为文字，再通过声音输出。合成的监护人声音，给儿童将故事、哼唱简单的儿歌等，能给予哭闹的儿童安抚，缓解儿童的不安心理。
[0030]进一步的，还有一与所述机器人信号收发模块通讯连接的远程服务器，所述远程服务器与若干机器人通讯连接，所述远程服务器收集并处理各机器人采集的哭声数据，得到用于判断疼痛性哭声的基频频率和能量最大值的平均值，并反馈给各机器人调整其判断阀值。
[0031]由于儿童声音发育变化较快，所以判断哭声的阀值利用大数据技术，根据各机器人中采集的哭声样本，首先取单个样本基频最大值的均值，然后再对同一年龄的不同样本的基频最大值获取均值，最后得到该年龄的基频统计最大值，远程服务器定期的将所述基频统计最大值，更新至相应的机器人音频判断模块，以达到提高判断准确率的效果，如图3所示，基频最大值大于某特定值即指的是基频统计最大值。
[0032]—种辨识儿童哭声的方法，具体步骤如下，
1)通过音频采集模块实时采集特定区域的音频信息；
2)音频处理模块将采集到的音频信息进行FFT变换，统计得到的基频频率和能量波形；
3)音频判断模块，根据基频频率和能量波形，判断所述音频是否为哭声；
4)音频判断模块，在判断为哭声的音频后，进一步的将基频频率和能量最大值大于阀值的音频判断为疼痛性哭声；
5)基频频率最大值小于阀值且波形平稳的哭声音频判断为饥饿性哭声;波形平稳且每帧能量低于饥饿性哭声的哭声音频判断为困乏性哭声。
【主权项】
1.一种儿童看护型机器人，其特征在于，包括主控模块、儿童哭声识别模块和信号收发丰旲块，主控模块，收到儿童哭声识别模块发来的儿童正在哭闹信息的相应信号后，控制信号收发模块发送信息；儿童哭声识别模块，与主控模块连接，包括音频采集模块、音频处理模块和音频判断模块，其中音频采集模块实时采集特定区域的音频信息；音频处理模块将采集到的音频信息进行FFT变换，统计得到的基频频率和能量波形;音频判断模块，根据得到的基频频率和能量波形，判断所述音频是否为哭声;在判断为哭声的音频后，进一步的根据基频频率和能量最大值判断疼痛性哭声和非疼痛性哭声，主控模块根据音频判断模块发送的信息，控制信号收发模块发出相应的提示信号。信号收发模块，与主控模块连接，根据主控模块接收到儿童正在哭闹的信号后，发送儿童哭闹的提示信号给预设APP的移动终端。2.根据权利要求1所述的一种儿童看护型机器人，其特征在于，所述非疼痛性哭声，进一步的将其中能量均匀的音频，判断为饥饿哭声；能量均匀且每帧能量都低于饥饿哭声的音频判断为困乏哭声。3.根据权利要求1或2所述的一种儿童看护型机器人，其特征在于，还包括图像模块，与主控模块连接，包括图像采集模块和图像存储模块，图像采集模块采集儿童及其周围图像信息，当主控模块收到音频判断模块发送的哭声信息时，启动图像采集模块，将采集的图像信息转入图像存储模块，并通过信号收发模块向预设APP的移动终端发送实时图像或视频。4.根据权利要求1或2所述的一种儿童看护型机器人，其特征在于，还包括人声交互模块，与主控模块连接，包括人声采集模块、人声处理模块、声音存储模块和播放模块，人声采集模块用于采集监护人的声源，人声处理模块去除声源噪音，将声源存储至声音存储模块，播放模块能调取声音存储模块中的声源播放，主控模块收到音频判断模块发送的哭声信息时，启动人声交互模块播放存储模块中的监护人声音。5.根据权利要求4所述的一种儿童看护型机器人，其特征在于，所述人声交互模块，还包括人声模拟模块，所述人声模拟模块提取声音存储模块中的音源，合成模拟监护人声音，通过播放模块向儿童播放。6.根据权利要求1所述的一种儿童看护型机器人，其特征在于，还有一与所述机器人信号收发模块通讯连接的远程服务器，所述远程服务器与若干机器人通讯连接，所述远程服务器收集并处理各机器人采集的哭声数据，得到用于判断疼痛性哭声的基频频率和能量最大值的平均值，并反馈给各机器人调整其判断阀值。7.一种辨识儿童哭声的方法，具体步骤如下， .1)通过音频采集模块实时采集特定区域的音频信息； .2)音频处理模块将采集到的音频信息进行FFT变换，统计得到的基频频率和能量波形； .3 )音频判断模块，根据基频频率和能量波形，判断所述音频是否为哭声； .4)音频判断模块，在判断为哭声的音频后，进一步的将基频频率和能量最大值大于阀值的音频判断为疼痛性哭声； .5)基频频率最大值小于阀值且波形平稳的哭声音频判断为饥饿性哭声;波形平稳且每帧能量低于饥饿性哭声的哭声音频判断为困乏性哭声。
【文档编号】G10L25/21GK106024016SQ201610444852
【公开日】2016年10月12日
【申请日】2016年6月21日
【发明人】刘威鑫
【申请人】上海禹昌信息科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘威鑫;
技术所有人：上海禹昌信息科技有限公司;
我是此专利的发明人

上一篇：语音检测方法及装置的制造方法
上一篇：一种呼叫中心坐席人员监控方法及系统的制作方法