智能语音交互设备快速稳定的回声消除方法与流程

文档序号:15463902发布日期:2018-09-18 18:50阅读:260来源:国知局

本发明涉及语音信号处理技术领域,特别涉及一种智能语音交互设备快速稳定的回声消除方法。



背景技术:

智能语音设备通常通过语音与人交流,而智能语音设备所发出的声音会通过传声器传入系统,为了避免将其识别为用户的声音,需要通过回声消除技术将其去除。如果去除不干净会造成语音识别系统识别设备自身语音,导致交互混乱。智能语音设备自身发声通常使用回声消除技术来处理,其核心技术包括自适应滤波技术,而自适应滤波技术需要一段时间才能收敛,且在有其它非自身声音的噪声混入时会造成滤波器的发散,导致残余噪声较多。

目前的回声消除技术存在在初始阶段收敛速度较慢,造成较多自噪声残余,容易引起语音识别系统自激,造成交互混乱的问题,且即使滤波器达到稳定状态,在双讲情况下,依然容易引起滤波器发散,造成较多自噪声残余。



技术实现要素:

为解决以上问题,本发明提供一种智能语音交互设备快速稳定的回声消除方法,包括:

智能语音交互设备在第一次开机后播放预设的语音内容;

智能语音交互设备对第一次开机后所播放预设的语音内容通过自适应滤波技术对自噪声进行抑制,当自噪声达到预设的衰减值时,将此时的滤波器系数存储,得到存储的滤波器系数;

使用智能语音交互设备时,将所述存储的滤波器系数作为自适应滤波技术的初始化系数;并在跟踪过程中,将滤波器系数的增量限定在预设范围内。

优选的,所述预设的语音内容,

其频率分布的范围高于预设的范围值;

且其频率分布与预设的第二范围和预设的第三范围有交集,所述第二范围的上确界低于所述第三范围的下确界。

优选的,所述智能语音交互设备快速稳定的回声消除方法,还包括:

在所述播放预设的语音内容之前,智能语音交互设备检测环境噪声,当所述环境噪声的强度高于预设的预警强度时,智能语音交互设备向用户发出环境噪声影响语音交互的提醒。

优选的,所述预设的语音内容,包括提示用户保持环境安静的语音内容。

优选的,

所述第二范围的下确界不高于50Hz;

所述第三范围的上确界不低于1000Hz。

优选的,所述智能语音交互设备快速稳定的回声消除方法,还包括:

设定时间点;

检测环境噪声,当所述环境噪声的强度低于预设的检测强度时:

在设定的时间点,智能语音交互设备播放所述预设的语音内容;

智能语音交互设备对所播放预设的语音内容通过自适应滤波技术对自噪声进行抑制,当自噪声达到预设的衰减值时,将此时的滤波器系数存储,得到所述时间点的滤波器系数;

对比存储的滤波器系数和所述时间点的滤波器系数:

当两者之差小于预设的阈值时,仍将所述存储的滤波器系数作为自适应滤波技术的初始化系数;

当两者之差不小于预设的阈值时,将在所述设定的时间点的预设时长之后的时间点作为新的时间点,检测新的时间点的环境噪声,当所述环境噪声的强度不低于预设的检测强度时,将新的时间点再向后延迟预设时长,当所述环境噪声的强度低于预设的检测强度时,用得到所述时间点的滤波器系数的方法得到新的时间点的滤波器系数;

对比存储的滤波器系数、所述时间点的滤波器系数和新的时间点的滤波器系数;当其中两种滤波器系数之差最小且小于预设的阈值时,任选此两种滤波器系数种的一种作为自适应滤波技术的初始化系数,否则,仍将所述存储的滤波器系数作为自适应滤波技术的初始化系数。

优选的,

所述设定时间点,实施为:

设定初始时间间隔和最大时间间隔;

以第一次开机后的初始时间间隔为第一个设定的时间点;

当自适应滤波技术的初始化系数不改变时,以不小于1的预设系数乘以当前的时间间隔得到待比较时间间隔,选择待比较时间间隔与最大时间间隔中较小的值作为新的时间间隔;

以当前时间点的再向后延迟新的时间间隔作为新的时间点。

本发明的一些有益效果可以包括:

本发明提供的方法,通过设定特定的滤波器的初始化系数,可以加速自适应滤波器的收敛速度,同时在跟踪过程中,限定滤波器系数增量的范围,能够防止自适应滤波器的发散。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1为本发明实施例中一种智能语音交互设备快速稳定的回声消除方法的流程图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

图1为本发明实施例中一种智能语音交互设备快速稳定的回声消除方法的流程图,如图1所示,包括步骤:

步骤S101、智能语音交互设备在第一次开机后播放预设的语音内容;

步骤S102、智能语音交互设备对第一次开机后所播放预设的语音内容通过自适应滤波技术对自噪声进行抑制,当自噪声达到预设的衰减值时,将此时的滤波器系数存储,得到存储的滤波器系数;

步骤S103、使用智能语音交互设备时,将所述存储的滤波器系数作为自适应滤波技术的初始化系数;并在跟踪过程中,将滤波器系数的增量限定在预设范围内。

本发明提供的方法,通过设定特定的滤波器的初始化系数,可以加速自适应滤波器的收敛速度,同时在跟踪过程中,限定滤波器系数增量的范围,能够防止自适应滤波器的发散。

在本发明的一个优选实施例中,还在使用智能语音交互设备时,每间隔特定时间根据当前滤波效果和预设的阈值,动态的更新所存储的初始化滤波器系数,从而保证算法的鲁棒性,确保在使用环境和场景发生变化时方法依然有效。具体实施为,对使用初始化滤波器参数的自适应滤波效果进行评估,并与预设阈值进行比较,如所得抑制效果高于阈值门限,则说明所存储的滤波器系数与当前使用环境较为匹配,如果所得抑制效果低于预设的门限值,则说明使用环境发生了变化,需要对所存储的参数进行更新;

在本发明的另一个优选实施例中,还可以在使用过程中,每间隔特定时间对当前的滤波效果进行评估,如果优于之前所存储滤波器系数的滤波效果,则对存储参数进行更新,否则不进行更新。

由于智能语音交互设备所能发出的声音多种多样,而不可能将这些语音逐一进行播放来进行滤波器的设定,因此要求预设的语音内容能够包含更多的频率范围,在本发明的一个实施例中,所述预设的语音内容,

其频率分布的范围高于预设的范围值,其中频率分布一般为连续分布,预设的范围值一般为智能语音交互设备的发音的频率范围;

且其频率分布与预设的第二范围和预设的第三范围有交集,所述第二范围的上确界低于所述第三范围的下确界,第二范围用于限制频率分布的低频的范围,第三范围用于限制频率分布的高频的范围。

为了避免在获取滤波器系数的过程中受到明显的噪声干扰,需要事先检测环境的噪声强度,在本发明的一个实施例中,所述智能语音交互设备快速稳定的回声消除方法,还包括:

在所述播放预设的语音内容之前,智能语音交互设备检测环境噪声,当所述环境噪声的强度高于预设的预警强度时,智能语音交互设备向用户发出环境噪声影响语音交互的提醒。

为了避免用户或其它人员在播放预设的语音内容时讲话等情况的出现,影响滤波器系数的获取,在本发明的一个实施例中,所述预设的语音内容,包括提示用户保持环境安静的语音内容。

为了使用户交互时更自然,智能语音交互设备所能发出声音的频率应当和正常人说话的频率相近,为了实现这一目的,在本发明的一个实施例中,

所述第二范围的下确界不高于50Hz;

所述第三范围的上确界不低于1000Hz。

由于用户在使用的过程中可能会移动智能语音交互设备,或者对房间布置进行更改从而改变智能语音交互设备的周围环境,导致初始所确定的自适应滤波技术的初始化系数的效果不佳,为了避免这种情况,需要在确定自适应滤波技术的初始化系数后的一定时间里再次确定自适应滤波技术的初始化系数,在本发明的一个实施例中,所述智能语音交互设备快速稳定的回声消除方法,还包括:

设定时间点,如每一周周末的晚上8点;

检测环境噪声,当所述环境噪声的强度低于预设的检测强度时:

在设定的时间点,智能语音交互设备播放所述预设的语音内容;

智能语音交互设备对所播放预设的语音内容通过自适应滤波技术对自噪声进行抑制,当自噪声达到预设的衰减值时,将此时的滤波器系数存储,得到所述时间点的滤波器系数;

对比存储的滤波器系数和所述时间点的滤波器系数:

当两者之差小于预设的阈值时,仍将所述存储的滤波器系数作为自适应滤波技术的初始化系数;

当两者之差不小于预设的阈值时,将在所述设定的时间点的预设时长之后的时间点作为新的时间点,检测新的时间点的环境噪声,当所述环境噪声的强度不低于预设的检测强度时,将新的时间点再向后延迟预设时长,当所述环境噪声的强度低于预设的检测强度时,用得到所述时间点的滤波器系数的方法得到新的时间点的滤波器系数;

对比存储的滤波器系数、所述时间点的滤波器系数和新的时间点的滤波器系数;当其中两种滤波器系数之差最小且小于预设的阈值时,任选此两种滤波器系数种的一种作为自适应滤波技术的初始化系数,否则,仍将所述存储的滤波器系数作为自适应滤波技术的初始化系数。

在本发明的另一个优选实施例中,还在每次设备重启后,对使用初始化滤波器参数的自适应滤波效果进行评估,并与预设阈值进行比较,如所得抑制效果高于阈值门限,则说明所存储的滤波器系数与当前使用环境较为匹配,如果所得抑制效果低于预设的门限值,则说明使用环境发生了变化,需要对所存储的参数进行更新;

在使用过程中,每间隔特定时间对当前的滤波效果进行评估,如果优于之前所存储滤波器系数的滤波效果,则对存储参数进行更新,否则不进行更新。

由于有的用户喜欢经常改变家里的布局,而有些用户则很少去改变家里的布局,对于前一种用户,需要经常的去设定自适应滤波技术的初始化系数,而对于后一种用户,则不需要经常的改变自适应滤波技术的初始化系数,为了尽量少的干扰到用户,可以通过动态的调节改变自适应滤波技术的初始化系数的周期来实现,在本发明的一个实施例中,

所述设定时间点,实施为:

设定初始时间间隔和最大时间间隔;

以第一次开机后的初始时间间隔为第一个设定的时间点;

当自适应滤波技术的初始化系数不改变时,以不小于1的预设系数乘以当前的时间间隔得到待比较时间间隔,选择待比较时间间隔与最大时间间隔中较小的值作为新的时间间隔;

以当前时间点的再向后延迟新的时间间隔作为新的时间点。

本发明提供的方法,通过设定特定的滤波器的初始化系数,可以加速自适应滤波器的收敛速度,同时在跟踪过程中,限定滤波器系数增量的范围,能够防止自适应滤波器的发散。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1