一种环噪消除系统及其应用方法与流程

文档序号:12609234阅读:183来源:国知局

本发明涉及智能语音交互领域,尤其涉及一种环噪消除系统及其应用方法。



背景技术:

随着机器人的应用领域扩大和人工智能技术的飞速发展,面向普通家庭的智能机器人开始被人们关注。面向家庭的智能机器人是一种有别于工业控制机器人的具有一定外界感知能力及处理能力的拟人机器系统。家庭机器人不同于传统工业机器人,其最重要的特征就是便于交互,而最自然的交互方式就是语音交互,然而人与机器的语音交互存在极大的不确定性,其中关键问题之一就是日常环境噪声对有效语音的影响较大,日常环境中的噪声会导致机器人无法识别或误识别人类的语音,最后导致语音交互的效果大打折扣。目前大多数应用于家庭的智能机器人由于缺少对环境噪声的有效消除方法,在信噪比较低的环境中几乎无法正常工作。而另外一些智能设备多将应用于传统电话通信领域的语音增强技术应用于家庭智能设备上,应用于电话通信的传统环境噪声消除与语音增强技术大多对说话人和设备的交互距离提出了一定的限制。除此之外,一些应用于传统电话通信领域的语音增强技术仅对稳态噪声有较好的效果,对日常环境中的一些非稳态噪声则效果较差。

家庭智能机器人是一个全新的领域,目前环境噪声消除技术针对 该领域还没有较深的研究和应用,传统的环境噪声消除技术多用于电话通信,这些技术的主要目的是防止环境背景噪声对通信质量的影响。目前基于语音交互的智能设备使用的常见环境噪声消除技术多来自传统电话通信的已有技术,这些技术有频谱相减法,维纳滤波法,自适应噪声抵消法。这些方法应用到机器人领域都存在一些问题。频谱相减法是一种用语音段幅值均值减去无语音段间隙取得噪声均值,然后利用噪声均值做噪声消除的方法,该方法对非稳态噪声有较差的效果,容易造成噪声消除后的语音失真,从而导致语音识别率下降。维纳滤波法则是利用维纳滤波器的传递函数,将噪声幅值均值与语音段幅值进行卷积,得到噪声消除后信号的幅值信息。维纳滤波法不会造成较严重的语音失真,并且能有效的抑制环境中的变化范围不大或较稳定的噪声。但是该方法是通过计算无声期间的统计平均来估计噪声功率谱来估计噪声均值,这种估计是以噪声功率谱在发声前和发声后变化不大作为前提下的,故在变化较大的非稳态噪声情况下,该方法无法获得较好的降噪效果。另一种在智能设备上多采用的环境噪音消除方法是定向麦克风加自适应噪声抵消的方法,该方法使用一个全向麦克风用于收集环境噪音,一个定向麦克风收集用户语音,然后针对两种信号做自适应降噪抵消来获得纯净的语音信号。上述方法在传统电话手机上有较好的环境噪音消除效果,而在机器人上却无法适用。这是因为上述方法依赖定向麦克风来收集用户语音,这就要求用户和定向麦克风保持一定的距离和方向,显然在家庭机器人环境下该方法无法适用。



技术实现要素:

鉴于上述问题,本发明提供一种环噪消除方法,应用于家庭机器人,其特征在于,包括以下步骤:

步骤S1,一采集单元对所述机器人当前所处环境中的声音信号进行采样,获取与所述声音信号相匹配的音频信号,并对所述音频信号通过傅里叶变换分析获取与所述音频信号相匹配的采集频谱信号,其中所述音频信号由复数个音频帧信号组成;

步骤S2,按照预定的方法判断当前所述的音频帧是否匹配一预设的语音帧;

步骤S3,于所述音频帧匹配所述语音帧的状态下,更新所述采集频谱中每个所述音频帧所对应的一噪声功率谱;

步骤S4,获取所述采集频谱中的所述噪声功率谱的增益,并根据所述增益对所述采集频谱进行傅里叶变换计算,形成一计算结果输出;

步骤S5,对所述计算结果进行傅里叶逆变换,去除所述音频信号中的噪声以获取有效音频信号。

上述的方法,其特征在于,所述步骤3中还包括:

步骤31、于所述音频帧不匹配所述语音帧的状态下,读取当前的所述噪声功率谱;于所述噪声功率谱为0的状态下,执行步骤33;

步骤32、根据所述噪声功率谱和所述采集频谱处理计算得到新功率噪声谱,并将所述新功率噪声谱赋值于所述功率噪声谱;

步骤33、根据当算所处环境中的噪声方差计算并更新所述噪声功率谱。

上述的方法,其特征在于,所述步骤32中,所述噪声功率谱和所述采集频谱按照平滑处理方法得到新功率噪声谱。

一种环噪消除系统,应用于家庭机器人中,其特征在于,包括:采集单元,用以对所述机器人当前所处环境中的声音信号进行采样获取与所述声音信号相匹配的音频信号,并对所述音频信号通过傅里叶变换分析获取与所述音频信号相匹配的采集频谱信号,其中,所述声音信号中包括噪声信号,所述音频信号由复数个音频帧信号组成;

判断单元,连接所述采集单元,用以按照预定的方法判断当前所述的音频帧是否匹配一预设的语音帧;并形成一判断结果输出;

更新单元,连接所述判断单元,于所述判断结果为所述音频帧匹配所述语音帧的状态下,更将所述采集频谱中每个所述音频帧所对应的一噪声功率谱;

计算单元,连接所述更新单元,获取所述采集频谱中的所述噪声功率谱的增益,并根据所述增益对所述采集频谱进行傅里叶变换计算,形成一计算结果输出;

处理单元,连接所述计算单元,用以接收所述计算单元输出的所述计算结果,对所述计算结果进行傅里叶逆变换处理,去除所述音频信号中的噪声以获取有效音频信号。

上述的系统,其特征在于,所述采集单元中包括:

一缓冲单元,用以接收所述采集单元获取的所述声音信号

一微处理单元,连接所述缓冲单元,用以对所述缓冲单元中的所述声音信号进行冲采样处理。

上述的系统,其特征在于,于所述缓冲单元中,所述声音信号按照预定的音频数据包形式存储于所述缓冲单元中。

上述的系统,其特征在于,所述音频处理框架层还包括:

读取单元,连接所述缓冲单元,用以读取存储于所述缓冲单元中的预定的所述音频数据包。

上述的系统,其特征在于,所述音频数据包时长为10ms。

综上所述,本发明设计的一种环噪消除系统及其应用方法是应用于以语音交互作为交互基础的家庭智能机器人的环境噪音消除的完整软件技术方案,解决传统环境噪音消除对变化范围较大的非稳定噪声效果不好的问题。

附图说明

参考所附附图,以更加充分的描述本发明的实施例。然而,所附附图仅用于说明和阐述,并不构成对本发明范围的限制。

图1为本发明算法流程示意图。

具体实施方式

为了使本发明的技术方案及优点更加易于理解,下面结合附图作进一步详细说明。应当说明,此处所描述的具体实施例仅仅用以解释 本发明,并不用于限定本发明。

本发明的核心思想是:首先对音频数据根据频谱能量来检测是否为有效语音起始帧,如果无有效语音,则统计平均的噪声方差作为噪声功率谱的初始值。当检测到有效语音起始帧后,根据噪声功率谱的估计来判断当前信号是噪声还是有效语音信号。如果是噪声,则对将之前的噪声功率谱与当前帧的功率谱做平滑处理,更新对噪声功率谱的估计,如果是语音,则更新当前语音帧频谱中每个点的噪声功率谱,然后使用最小均方误差判别法计算出当前帧的纯净音傅里叶变化的估值,然后使用反傅里叶变换得到环境音消除后的当前帧。

所以本发明涉及一种环噪消除方法,该方法应用于家庭机器人,其中包括有以下步骤:

步骤S1,一采集单元对机器人当前所处环境中的声音信号进行采样,获取与声音信号相匹配的音频信号,并对音频信号通过傅里叶变换分析获取与音频信号相匹配的采集频谱信号,其中音频信号由复数个音频帧信号组成;

步骤S2,按照预定的方法判断当前的音频帧是否匹配一预设的语音帧;

步骤S3,于音频帧匹配语音帧的状态下,更新采集频谱中每个音频帧所对应的一噪声功率谱;

步骤S4,获取采集频谱中的噪声功率谱的增益,并根据增益对采集频谱进行傅里叶变换计算,形成一计算结果输出;

步骤S5,对计算结果进行傅里叶逆变换,去除音频信号中的噪声以获取有效音频信号。

其中,在步骤S3中还包括:

步骤31、于音频帧不匹配语音帧的状态下,读取当前的噪声功率谱;于噪声功率谱为0的状态下,执行步骤33;

步骤32、根据噪声功率谱和采集频谱处理计算得到新功率噪声谱,并将新功率噪声谱赋值于功率噪声谱;

步骤33、根据当算所处环境中的噪声方差计算并更新噪声功率谱。

在步骤32中,噪声功率谱和采集频谱按照平滑处理方法得到新功率噪声谱。

另外,本发明根据该环噪消除方法设计了一种环噪消除系统,应用于家庭机器人中,包括:

采集单元,用以对机器人当前所处环境中的声音信号进行采样获取与声音信号相匹配的音频信号,并对音频信号通过傅里叶变换分析获取与音频信号相匹配的采集频谱信号,其中,声音信号中包括噪声信号,音频信号由复数个音频帧信号组成;

判断单元,连接采集单元,用以按照预定的方法判断当前的音频帧是否匹配一预设的语音帧;并形成一判断结果输出;

更新单元,连接判断单元,于判断结果为音频帧匹配语音帧的状态下,更将采集频谱中每个音频帧所对应的一噪声功率谱;

计算单元,连接更新单元,获取采集频谱中的噪声功率谱的增益,并根据增益对采集频谱进行傅里叶变换计算,形成一计算结果输出;

处理单元,连接计算单元,用以接收计算单元输出的计算结果,对计算结果进行傅里叶逆变换处理,去除音频信号中的噪声以获取有效音频信号。

在本发明中,采集单元中包括:

一缓冲单元,用以接收采集单元获取的声音信号;

一微处理单元,连接缓冲单元,用以对缓冲单元中的声音信号进行冲采样处理。

在本发明中,于缓冲单元中,声音信号按照预定的音频数据包形式存储于缓冲单元中。

在本发明中,音频处理框架层还包括:

读取单元,连接缓冲单元,用以读取存储于缓冲单元中的预定的音频数据包。

下面结合实施例进行具体说明

针对目前只能机器人环境降噪碰到的问题,线提出一种应用于智能家庭机器人的环境噪音消除技术方案:

一套预设嵌入式系统中实现音频采集,处理的软件系统层框架及音频降噪处理算法,应用于家庭智能机器人,其中软件系统包括:

采集单元,用于从特定的音频设备中采集音频流数据的软件驱动程序;

其中采集单元中还包括:

一个缓冲单元和微处理单元,缓冲单元用以接收采集单元获取的声音信号,微处理单元连接缓冲单元,用来对缓冲单元中的声音信号进行重采样处理,以及一读取单元组成的降噪处理软件层,读取单元连接所述缓冲单元,用以读取储存在缓冲单元中的预定音频数据包。其中微处理单元从缓冲单元中读取音频数据流后,并对音频数据流进行必要的重采样处理,然后切割成10毫秒的音频数据包填充到缓冲单元,其中读取单元用于从缓冲单元中读取经过预处理的音频数据包,然后输送到算法进行环境噪音消除处理;

判断单元,与采集单元连接,用以按照预定的方法判断当前音频帧是否匹配一预设的语音帧,形成一判断结果输出,并适配不同的底层驱动以及上层应用软件的适配软件程序;

更新单元,与该判断单元连接,于判断结果为音频帧匹配语音帧的状态下,更新采集频谱中每个音频帧对应的一噪声功率谱;

计算单元,获取采集频谱中的噪声功率谱的增益,并根据增益对采集频谱进行傅里叶变换计算,形成一计算结果输出;

处理单元,连接计算单元,用以接受计算单元输出的计算结果,对计算结果进行傅里叶逆变换处理,去除音频中的噪声以获取有效音频信号。

应用接口,将获取的有效音频信号发送给上层应用。

如图1所示,针对上述系统的应用,还涉及一种环噪消除的计算方法:

步骤S1,家庭智能机器人通过音频设备采集声音信号,获取与声音信号相匹配的音频数据,然后根据音频数据的能量检测该采集到的音频数据是否为有效语音起始帧,如果检测的结果显示为无效的语音数据,则统计一下平均的噪声方差作为噪声功率谱的初始值,如果检测到的结果显示为有效语音,则继续进行下一步。

其中,在步骤S1中,家庭智能机器人通过对采集到的音频数据进行离散傅里叶变换来得到被采集的音频数据的频谱,离散傅里叶变换是通过把信号从时间域变换到频率域,进而研究信号的频谱结构和变化规律。

步骤S2,根据步骤S1中的统计的噪声功率谱的估计来判断采集到音频数据是否为噪声,如果是噪声,则将该噪声的功率谱和之前统计的噪声功率谱做平滑处理,在进行完平滑处理后更新噪声功率谱的估计,如果检测到的不是噪声,而是正常的命令语音,则进行下一步。

步骤S3,更新被采集到音频数据的语音帧频谱中每个点的噪声功率谱,然后计算该音频数据的纯净音傅里叶变化估值,在本发明中,通过使用最小均方误差判别法计算该语音帧的纯净音傅里叶变化估值。

步骤S4,获取采集频谱中的噪声功率增益,并根据增益对所采集频谱进行傅里叶变换计算,形成一计算结果输出。

步骤S5,去除被采集到音频数据中的环境音,以获得纯净音,这样只能机器人就能很清楚的得到命令内容,在本发明中,通过离散傅里叶逆变换去除音频数据中的环境音。

所以在一个基于安卓嵌入式智能操作系统的基于语音交互的家庭智能机器人中,需要机器人在语音采集后进行环境噪音消除以提高语音识别正确率。

综上所述,本发明设计的一种环噪消除系统及其应用方法是应用于以语音交互作为交互基础的家庭智能机器人的环境噪音消除的完整软件技术方案,解决传统环境噪音消除对变化范围较大的非稳定噪声效果不好的问题。

通过说明和附图,给出了具体实施方式的特定结构的典型实施例,基于本发明精神,还可作其他的转换。尽管上述发明提出了现有的较佳实施例,然而,这些内容并不作为局限。

对于本领域的技术人员而言,阅读上述说明后,各种变化和修正无疑将显而易见。因此,所附的权利要求书应看作是涵盖本发明的真实意图和范围的全部变化和修正。在权利要求书范围内任何和所有等价的范围与内容,都应认为仍属本发明的意图和范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1