机器人降噪方法、装置及机器人与流程

文档序号:11730575阅读:360来源:国知局
机器人降噪方法、装置及机器人与流程

本发明实施例涉及机器人领域,尤其是一种机器人降噪方法、装置及机器人。



背景技术:

随着移动通信、计算机以及互联网技术的发展,计算机设备的微型化时代来临,由于计算机软件的高度集成化,以及强大的处理能力,能够使较小的智能装置具有强大的处理能力。在机器人领域,由于计算机的强大处理能力,使小型的陪护机器人成为可能,陪护机器人是通过语音或其他能够与用户交流的交互型智能设备,能够作为用户的生活学习的好朋友,现有技术中,为方便用户下达指令或交流,通常使用语音指令进行控制,机器人接受用户发出的语音指令,然后执行相应命令,为使机器人能够准确的识别用户指令,机器人需要对接受的包括用户指令和环境噪音复合之后的混合信号进行降噪处理。

现有技术中,常用的降噪方法包括:噪声门降噪法、采样降噪法和滤波降噪法。其中,噪声门降噪法设定一个门限,比如噪音最大峰值,那么把它设定为阀值,低于此值的信号直接归零,大于此值的信号没有变化,这样,就可以把噪音消去。采样降噪法采集一个噪音样本,要求是比较单纯的噪音,然后以此样本为依据,消除混音中的噪音。波降噪法首先要明确地知道噪声信号中的噪音在哪个频率段,然后通过降噪软件将这个频率段的信号减弱,来达到降噪效果。

本发明创造的发明人在研究中发现,噪声门降噪法的缺点在于在噪声信号不在阈值范围内的噪声中仍然保留着无法清除。采样降噪法在消除噪音同时,会影响到混音信号中与噪声同频率的有效信号,同时有一定的失真感。滤波降噪法,同样的对于噪音同频段的有效信号起到干扰,因此,现有技术中已经存在的降噪技术无法应用于机器人降噪领域,现在迫切的需要一款能够在机器人上使用的高效降噪方法。



技术实现要素:

本发明实施例主要解决的技术问题是提供能够高效降噪的机器人降噪方法、装置及机器人。

为解决上述技术问题,本发明创造的实施例采用的一个技术方案是:提供一种机器人降噪方法,包括下述步骤:

读取预设的控制音源样本;

获取外界环境的混音信号,将所述控制音源样本与所述混音信号进行比对,区别出所述混音信号中与所述控制音源样本频率相同的目标信号,以及与所述控制音源样本频率不相同的噪声信号;

放大所述目标信号,缩放所述噪声信号以使所述目标信号波形所表征的音频功率大于所述噪声信号波形表征的音频功率。

可选地,所述放大所述目标信号,缩放所述噪声信号以使所述目标信号波形所表征的音频功率大于所述噪声信号波形表征的音频功率的步骤之前还包括:

获取所述噪声信号的特征参数,所述特征参数包括频段、频谱、幅度或功率特征;

根据所述噪声信号的特征参数,对所述噪声信号进行降噪。

可选地,使用所述降噪方法的机器人至少包括第一语音采集装置和第二语音采集装置,所述获取所述噪声信号的特征参数,所述特征参数包括频段、频谱、幅度或功率特征的步骤之前还包括:

通过所述第一语音采集装置和第二语音采集装置检测在指定方向上分布的混音信号,由此产生由第一语音采集装置输出的第一音频信号,和第二语音采集装置输出的第二音频信号;

基于所述第一音频信号和第二音频信号的幅度或功率的幅度的差来衰减所述混音信号。

可选地,根据所述噪声信号的特征参数,对所述噪声信号进行降噪的步骤包括:

将所述第一音频采集装置采集的混音信号的特征参数输入到预设的降噪模型中;

采用所述降噪模型对所述第一音频采集装置采集的混音信号进行降噪。

可选地,所述采用所述降噪模型对所述第一音频采集装置采集的混音信号进行降噪的步骤包括:

检测所述第一音频采集装置采集的混音信号的频段是否位于人声频段范围内;

若所述第一音频采集装置采集的混音信号的频段位于所述人声频段范围内,则对所述第一音频采集装置采集的混音信号进行放大;

若所述第一音频采集装置采集的混音信号的频段不位于所述人声频段范围内,则对所述第一音频采集装置采集的混音信号进行缩放。

可选地,所述将所述第一音频采集装置采集的混音信号的特征参数输入到预设的降噪模型中的步骤包括:

根据所述第一音频信号和第二音频信号的幅度或功率的幅度的差值确定所述降噪模型的频率。

可选地,所述降噪模型的频率为低频。

可选地,所述第一音频采集装置与第二音频采集装置延长线之间的夹角大于60°。

为解决上述技术问题,本发明实施例还提供一种机器人降噪装置,包括:

读取模块,用于读取预设的控制音源样本;

获取比较模块,用于获取外界环境的混音信号,将所述控制音源样本与所述混音信号进行比对,区别出所述混音信号中与所述控制音源样本频率相同的目标信号,以及与所述控制音源样本频率不相同的噪声信号;

除噪模块,用于放大所述目标信号,缩放所述噪声信号以使所述目标信号波形所表征的音频功率大于所述噪声信号波形表征的音频功率。

可选地,所述机器人降噪装置还包括:

第一获取子模块,用于获取所述噪声信号的特征参数,所述特征参数包括频段、频谱、幅度或功率特征;

第一降噪子模块,用于根据所述噪声信号的特征参数,对所述噪声信号进行降噪。

可选地,所述机器人降噪装置还包括:

第一语音采集装置和第二语音采集装置,通过所述第一语音采集装置和第二语音采集装置检测在指定方向上分布的混音信号,由此产生由第一语音采集装置输出的第一音频信号,和第二语音采集装置输出的第二音频信号;

第一衰减子模块,用于基于所述第一音频信号和第二音频信号的幅度或功率的幅度的差来衰减所述混音信号。

可选地,所述机器人降噪装置还包括:

第一输入子模块,用于将所述第一音频采集装置采集的混音信号的特征参数输入到预设的降噪模型中;

第二降噪子模块,用于采用所述降噪模型对所述第一音频采集装置采集的混音信号进行降噪。

可选地,所述机器人降噪装置还包括:

第一监测判断子模块,用于检测所述第一音频采集装置采集的混音信号的频段是否位于人声频段范围内;若所述第一音频采集装置采集的混音信号的频段位于所述人声频段范围内,则对所述第一音频采集装置采集的混音信号进行放大;若所述第一音频采集装置采集的混音信号的频段不位于所述人声频段范围内,则对所述第一音频采集装置采集的混音信号进行缩放。

可选地,所述机器人降噪装置还包括:

第一确定子模块,用于根据所述第一音频信号和第二音频信号的幅度或功率的幅度的差值确定所述降噪模型的频率。

可选地,所述降噪模型的频率为低频。

可选地,所述第一音频采集装置与第二音频采集装置延长线之间的夹角大于60°。

为解决上述技术问题,本发明实施例还提供一种机器人,包括:

一个或多个处理器;

存储器;

一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:

读取预设的控制音源样本;

获取外界环境的混音信号,将所述控制音源样本与所述混音信号进行比对,区别出所述混音信号中与所述控制音源样本频率相同的目标信号,以及与所述控制音源样本频率不相同的噪声信号;

放大所述目标信号,缩放所述噪声信号以使所述目标信号波形所表征的音频功率大于所述噪声信号波形表征的音频功率。

可选地,所述一个或多个程序还被配置用于:

获取所述噪声信号的特征参数,所述特征参数包括频段、频谱、幅度或功率特征;

根据所述噪声信号的特征参数,对所述噪声信号进行降噪。

可选地,所述机器人至少包括第一语音采集装置和第二语音采集装置,所述获取所述噪声信号的特征参数;

所述一个或多个程序还被配置用于:

通过所述第一语音采集装置和第二语音采集装置检测在指定方向上分布的混音信号,由此产生由第一语音采集装置输出的第一音频信号,和第二语音采集装置输出的第二音频信号;

基于所述第一音频信号和第二音频信号的幅度或功率的幅度的差来衰减所述混音信号。

可选地,所述一个或多个程序还被配置用于:

将所述第一音频采集装置采集的混音信号的特征参数输入到预设的降噪模型中;

采用所述降噪模型对所述第一音频采集装置采集的混音信号进行降噪。

可选地,所述一个或多个程序还被配置用于:

检测所述第一音频采集装置采集的混音信号的频段是否位于人声频段范围内;

若所述第一音频采集装置采集的混音信号的频段位于所述人声频段范围内,则对所述第一音频采集装置采集的混音信号进行放大;

若所述第一音频采集装置采集的混音信号的频段不位于所述人声频段范围内,则对所述第一音频采集装置采集的混音信号进行缩放。

可选地,所述一个或多个程序还被配置用于:

根据所述第一音频信号和第二音频信号的幅度或功率的幅度的差值确定所述降噪模型的频率。

可选地,所述降噪模型的频率为低频。

可选地,所述第一音频采集装置与第二音频采集装置延长线之间的夹角大于60°。

本发明实施例的有益效果为:本实施例通过将预先设置的用户或者人类音频翻盖范围作为控制音源样本,将该控制音源样本与混音信号进行比较,区别出用户发出的目标信号与噪音信号,并对目标信号进行放大处理,对噪音信号进行缩放处理,在一扩一缩的处理方式下,使目标信号的功率远远大于噪音信号的功率,在不损失目标信号的情况下实现了降噪,能够使机器人在复杂的外界环境中清楚地辨识用户的控制指令,提高了机器人控制的灵敏度与稳定性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例机器人降噪方法基本流程图;

图2为本发明实施例降噪方法的一种实施方式的基本流程图;

图3为本发明实施例第一音频采集装置降噪的基本流程图;

图4为本发明实施例机器人降噪装置基本结构框图;

图5为本发明实施例机器人的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。

在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

请参阅图1,图1为本实施例机器人降噪方法基本流程图。

如图1所示,一种机器人降噪方法,包括下述步骤:

s1100、读取预设的控制音源样本。在机器人的控制器内预设控制音源样本,控制音源样本是通过机器人在安静的环境中多次采集用户的语音指令的特征信息,所述特征参数包括频段、频谱、幅度或功率特征,采用上述方式生成的控制音源样本,具有更具保密性,在一般的环境下机器人只受控于特定的一个或者几个控制音源样本用户的控制。在一些选择性实施例中,控制音源样本是通过人类本身音频特性生成的,控制音源样本中的特征信息不是单个的或者有限个用户的音频特征信息,而是人类音频所具有的特征信息,更具有普遍效应方便推广。

s1200、获取外界环境的混音信号,将所述控制音源样本与所述混音信号进行比对,区别出所述混音信号中与所述控制音源样本频率相同的目标信号,以及与所述控制音源样本频率不相同的噪声信号。机器人获取外界的包括有效目标控制信号与机器人周围环境的混音信号,并将该混音信号的中的特征信息与控制音源样本的特征信息进行比对,分辨出与控制音源样本特征信息相同的且具有连贯性的音频信号,该音频信号为用户发出的目标信号,与控制音源样本特征信息不相同的信号为周围的噪声信号。

s1300、放大所述目标信号,缩放所述噪声信号以使所述目标信号波形所表征的音频功率大于所述噪声信号波形表征的音频功率。通过机器人内部的信号放大器或者信号放大电路,对目标信号进行放大处理,通过缩放器或者缩放线路对噪声信号进行缩放处理,使目标信号波形所表征的音频功率远大于所述噪声信号波形表征的音频功率,以此实现降噪功能。

上述实施方式通过将预先设置的用户或者人类音频翻盖范围作为控制音源样本,将该控制音源样本与混音信号进行比较,区别出用户发出的目标信号与噪音信号,并对目标信号进行放大处理,对噪音信号进行缩放处理,在一扩一缩的处理方式下,使目标信号的功率远远大于噪音信号的功率,在不损失目标信号的情况下实现了降噪,能够使机器人在复杂的外界环境中清楚地辨识用户的控制指令,提高了机器人控制的灵敏度与稳定性。

请参阅图2,图2为本实施例降噪方法的一种实施方式的基本流程图。

如图2所示,步骤s1300之前还包括:

s1210、获取所述噪声信号的特征参数,所述特征参数包括频段、频谱、幅度或功率特征。对于每个声音信号,均可以获取该声音信号的频率,对于每个声音信号均可以根据采集的多个频率确定一个频段,频段为频率范围,根据声音波形的振幅能够确定出声音的幅度,对整个音频信号能量的计算能够得出音频的功率特征。

s1220、根据所述噪声信号的特征参数,对所述噪声信号进行降噪。

在一些选择性实施例中,使用所述降噪方法的机器人至少包括第一语音采集装置和第二语音采集装置,通过所述第一语音采集装置和第二语音采集装置检测在指定方向上分布的混音信号,由此产生由第一语音采集装置输出的第一音频信号,和第二语音采集装置输出的第二音频信号。机器人内部设有至少两个语音采集装置,本实施例中语音采集装置具体是指麦克风。确定第一语音采集装置为主麦克风,第二语音采集装置为副麦克风。由于对于主麦克风来讲,该主麦克风采集到的声音信号通常可以包括语音信号(即人声)和噪声信号,而由于主麦克风和各个副麦克风是同时采集环境中的声音信号的,因此主麦克风采集到的噪声信号也通常会被其他至少一个副麦克风采集,因此,利用这些副麦克风与主麦克风的结合可以获取到比较准确的噪声信号,然后利用准确的噪声信号对主麦克风采集到的声音信号降噪时的准确度会比较高。

步骤s1210之前还包括:基于所述第一音频信号和第二音频信号的幅度或功率的幅度的差来衰减所述混音信号。

由于声音在空气中传播时,会随着传播而衰减,也即声音传播的距离越长,声音的音量越小,因此麦克风采集到的声音信号的音量与该麦克风到产生该声音信号的声源的距离成正相关关系,也即,当麦克风到产生该声音信号的声源的距离较小时,该麦克风采集到的声音信号的音量则较大,反之,当麦克风到产生该声音信号的声源的距离较大时,该麦克风采集到的声音信号的音量则较小。测量主副麦克风功率(在每个频段中)。第一、第二音频信号中的每个通道的功率独立地通过判定装置来确定。计算出主副麦克风的功率差值,然后通过公用函数计算出功率之差。并根据该差值对第一音频信号进行相应的音频衰减,然后比较主副麦克风的功率,对功率超出部分进行相应抹去处理进行降噪。在一些选择性实施例中,通过音频信号频段、频谱或幅度对第一音频信号进行衰减计算。

请参阅图3,图3为本实施例第一音频采集装置降噪的基本流程图。

s1221、将所述第一音频采集装置采集的混音信号的特征参数输入到预设的降噪模型中。第一音频采集装置为本实施方式中的主麦克风,为机器人音频是别的主要信号来源,将第一音频采集装置输出的第一音频信号的特征参数进行提取,并将提取的特征参数放入到降噪模型中进行降噪。降噪模型是通过对某一类或者某一个人的音频特征信息构成的区间或者范围性的数学模型。

s1222、采用所述降噪模型对所述第一音频采集装置采集的混音信号进行降噪。根据降噪模型中的若干个特性信息的阈值区间对第一音频采集装置采集的混音信号切割,将不在降噪模型若干个特性信息的阈值区间内的音频信号均进行软件处理,以此将第一音频信号的各项指标均规范在一定的区间范围内,以此达到降噪的目的。

具体地,检测所述第一音频采集装置采集的混音信号的频段是否位于人声频段范围内;若所述第一音频采集装置采集的混音信号的频段位于所述人声频段范围内,则对所述第一音频采集装置采集的混音信号进行放大;若所述第一音频采集装置采集的混音信号的频段不位于所述人声频段范围内,则对所述第一音频采集装置采集的混音信号进行缩放。

在一些选择新实施例中,机器人能够接受不同信号源的控制,包括用户语音和无线遥控。预存储的降噪模型中包括人声降噪模型和无线降噪模型需要通过计算进行选择性使用降噪模型。根据所述第一音频信号和第二音频信号的幅度或功率的幅度的差值确定所述降噪模型的频率。

本实施方式用用于语音降噪的降噪模型为低频降噪模型。

在一些选择性实施例中,第一音频采集装置与第二音频采集装置延长线之间的夹角大于60°。第一音频采集装置与第二音频采集装置之间的夹角大于60°时,使第一音频采集装置与第二音频采集装置的衰减信号差值较大,能够最大限度的增加降噪可靠性。

为解决上述技术问题本发明还提供一种机器人降噪装置。请参阅图4,图4为机器人降噪装置基本结构框图。

如图4所示,一种机器人降噪装置,包括:读取模块2100、获取比较模块2200和除噪模块2300。其中,读取模块2100用于读取预设的控制音源样本;获取比较模块2200用于获取外界环境的混音信号,将所述控制音源样本与所述混音信号进行比对,区别出所述混音信号中与所述控制音源样本频率相同的目标信号,以及与所述控制音源样本频率不相同的噪声信号;除噪模块2300用于放大所述目标信号,缩放所述噪声信号以使所述目标信号波形所表征的音频功率大于所述噪声信号波形表征的音频功率。

本实施例通过将预先设置的用户或者人类音频翻盖范围作为控制音源样本,将该控制音源样本与混音信号进行比较,区别出用户发出的目标信号与噪音信号,并对目标信号进行放大处理,对噪音信号进行缩放处理,在一扩一缩的处理方式下,使目标信号的功率远远大于噪音信号的功率,在不损失目标信号的情况下实现了降噪,能够使机器人在复杂的外界环境中清楚地辨识用户的控制指令,提高了机器人控制的灵敏度与稳定性。

在一些实施例中,机器人降噪装置还包括:第一获取子模块和第一降噪子模块。其中,第一获取子模块用于获取所述噪声信号的特征参数,所述特征参数包括频段、频谱、幅度或功率特征;第一降噪子模块用于根据所述噪声信号的特征参数,对所述噪声信号进行降噪。

在一些实施例中,机器人降噪装置还包括:第一语音采集装置、第二语音采集装置和第一衰减子模块。第一语音采集装置和第二语音采集装置,通过所述第一语音采集装置和第二语音采集装置检测在指定方向上分布的混音信号,由此产生由第一语音采集装置输出的第一音频信号,和第二语音采集装置输出的第二音频信号;第一衰减子模块,用于基于所述第一音频信号和第二音频信号的幅度或功率的幅度的差来衰减所述混音信号。

在一些实施例中,机器人降噪装置还包括:第一输入子模块和第二降噪子模块。其中,第一输入子模块用于将所述第一音频采集装置采集的混音信号的特征参数输入到预设的降噪模型中;第二降噪子模块用于采用所述降噪模型对所述第一音频采集装置采集的混音信号进行降噪。

在一些实施例中,第一监测判断子模块,用于检测所述第一音频采集装置采集的混音信号的频段是否位于人声频段范围内;若所述第一音频采集装置采集的混音信号的频段位于所述人声频段范围内,则对所述第一音频采集装置采集的混音信号进行放大;若所述第一音频采集装置采集的混音信号的频段不位于所述人声频段范围内,则对所述第一音频采集装置采集的混音信号进行缩放。

在一些实施方式中,机器人降噪装置还包括:第一确定子模块,用于根据所述第一音频信号和第二音频信号的幅度或功率的幅度的差值确定所述降噪模型的频率。

在一些实施方式中,降噪模型的频率为低频。

在一些实施例中,所述第一音频采集装置与第二音频采集装置延长线之间的夹角大于60°。

为解决上述技术问题本实施例还提供一种机器人。

本实施例提供机器人的实施方式。具体请参阅图5,图5为机器人的结构框图。

请参阅图5,机器人包括:一个或多个处理器3110、存储器3120影像采集传感器3120和语音采集传感器3130,其中,影像采集传感器3120和语音采集传感器3130连接在处理器3110上。;一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:

读取预设的控制音源样本;

获取外界环境的混音信号,将所述控制音源样本与所述混音信号进行比对,区别出所述混音信号中与所述控制音源样本频率相同的目标信号,以及与所述控制音源样本频率不相同的噪声信号;

放大所述目标信号,缩放所述噪声信号以使所述目标信号波形所表征的音频功率大于所述噪声信号波形表征的音频功率。

上述实施例中的机器人,通过将预先设置的用户或者人类音频翻盖范围作为控制音源样本,将该控制音源样本与混音信号进行比较,区别出用户发出的目标信号与噪音信号,并对目标信号进行放大处理,对噪音信号进行缩放处理,在一扩一缩的处理方式下,使目标信号的功率远远大于噪音信号的功率,在不损失目标信号的情况下实现了降噪,能够使机器人在复杂的外界环境中清楚地辨识用户的控制指令,提高了机器人控制的灵敏度与稳定性。

需要指出的是本实施列中,机器人的存储器内存储用于实现本实施例中机器人降噪方法中的所有程序,处理器能够调用该存储器内的程序,执行上述机器人降噪方法所列举的所有功能。由于机器人实现的功能在本实施例中的机器人降噪方法进行了详述,在此不再进行赘述。

需要说明的是,本发明的说明书及其附图中给出了本发明的较佳的实施例,但是,本发明可以通过许多不同的形式来实现,并不限于本说明书所描述的实施例,这些实施例不作为对本发明内容的额外限制,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。并且,上述各技术特征继续相互组合,形成未在上面列举的各种实施例,均视为本发明说明书记载的范围;进一步地,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1