回声消除方法、装置、介质以及语音唤醒方法和设备与流程

文档序号:16906407发布日期:2019-02-19 18:22阅读:784来源:国知局
回声消除方法、装置、介质以及语音唤醒方法和设备与流程

本发明实施例涉及语音处理技术领域,尤其涉及一种回声消除方法、装置、介质以及语音唤醒方法和设备。



背景技术:

在通过语音唤醒待唤醒设备时,通常通过待唤醒设备的麦克风获取初始唤醒语音,然后对初始唤醒语音进行处理提取唤醒信号。其中,在对初始语音进行处理时,如果待唤醒设备存在外放语音,则需考虑采用回声消除技术去除初始唤醒语音中的由播放信号所产生的回音信号。

现有技术是在待唤醒设备的功放输出端采集音频信号,然后经i2s(集成电路内置音频总线)直接传输到aec(acousticechocancellation,回声消除)模块作为回采的播放信号,或是将采集的音频信号通过adc转换成数字信号,再经i2s传输到回声消除模块。回声消除模块使用回采的播放信号与麦克风录到的唤醒声音做比较,消除唤醒语音中的播放信号,留下人声。但此种方法通常不能完全将初始唤醒语音中的回声信号消除干净,语音唤醒效果较差。



技术实现要素:

本发明实施例提供了一种回声消除方法、装置、介质以及语音唤醒方法和设备,解决了现有技术的回声消除方法通常不能完全将初始唤醒语音中的回声信号消除干净,语音唤醒效果较差的问题,以提高回声消除效果。

第一方面,本发明实施例提供了一种回声消除方法,用于语音唤醒,包括:

获取待唤醒设备的待输出语音信号;

根据所述待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。

第二方面,本发明实施例还提供了一种回声消除装置,配置于语音唤醒设备中,包括:

第一获取模块,用于获取待唤醒设备的待输出语音信号;

唤醒语音确定模块,用于根据所述待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。

第三方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的回声确定方法。

第四方面,本发明实施例还提供了一种语音唤醒方法,包括:

通过麦克风获取待唤醒设备的初始唤醒语音;

根据所述初始唤醒语音和第一方面所述的回声消除方法确定唤醒语音;

根据所述唤醒语音确定启动信号,并通过所述启动信号启动待唤醒设备。

第五方面,本发明实施例还提供了一种语音唤醒设备,包括:

第二语音获取模块,用于通过麦克风获取待唤醒设备初始语音唤醒信号;

回声消除模块,用于根据权利要求1-5任一所述的回声消除方法和初始语音唤醒信号确定语音唤醒信号;

系统模块,用于根据所述唤醒语音确定启动信号,并根据所述启动信号启动待唤醒设备。

本发明提供的回声消除方法的技术方案,包括:获取待唤醒设备的待输出语音信号;根据待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。通过设备频率响应曲线与待输出语音信号,可以估计出待唤醒设备的播放机构所输出的播放信号,由于输出频响曲线引入了待唤醒设备的播放机构对待输出语音信号的影响,因此相对于现有技术仅基于待输出语音信号进行回声消除来说,可以大大提高回声消除效果,进而提高语音唤醒效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的回声消除方法的流程图;

图2是本发明实施例一提供的待唤醒设备的频率响应曲线示意图;

图3是本发明实施例二提供的回声消除装置的结构框图;

图4是本发明实施例三提供的语音唤醒方法的流程图;

图5是本发明实施例四提供的语音唤醒设备的结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,以下将参照本发明实施例中的附图,通过实施方式清楚、完整地描述本发明的技术方案,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

图1是本发明实施例一提供的回声消除方法的流程图。本实施例的技术方案适用于提高语音唤醒成功率的情况。该方法可以采用软件和/或硬件的方式实现,并配置在系统模块中应用。该方法具体包括如下步骤:

s101、获取待唤醒设备的待输出语音信号。

如果待唤醒设备带有播放功能,在对其进行语音唤醒时,麦克风所接收的初始唤醒语音中通常包含回声,该回声是由待唤醒设备的播放机构的播放信号产生的,由于在实际的使用场景中,不方便获得实际的播放信号,因此本实施例获取待输出语音信号。其中,待输出语音信号为系统模块至播放机构的语音传输路径上的语音输出信号,比如系统模块输出的语音输出信号,或者功放模块输出的语音输出信号。播放机构为扬声器。

s102、根据待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。

由于播放机构会对待输出语音信号产生影响,即播放机构播放出来的语音信号与播放前的语音信号的频率不同,为此,本实施例引入设备频率响应曲线(参见图2),即通过设备频率响应曲线模拟待唤醒设备的播放机构对应待输出语音信号的影响,从而根据待输出语音信号与设备频率响应曲线估计出待唤醒设备的播放机构所输出的播放信号,即得到估计播放信号。其中,频率响应是指将一个以恒电压输出的音频信号与系统相连接时,音箱产生的声压随频率的变化而发生增大或衰减、相位随频率而发生变化的现象,这种声压和相位与频率的相关联的变化关系称为频率响应。

估计播放信号得到后,基于自适应滤波器,根据估计播放信号和初始唤醒信号确定回音信号;从初始语音唤醒信号中减去回音信号以生成唤醒语音。相较于自适应滤波器根据待输出语音信号和初始唤醒信号所确定的回音信号,本实施例的自适应滤波器根据估计播放信号和初始唤醒信号确定的回音信号更接近实际场景,因此初始唤醒语音中的播放信号去除的更加干净,所得到的唤醒语音更加纯净,可大大提高语音唤醒的成功率。

设备频率响应曲线通常需要通过测试手段获取,然后将其存储在待唤醒设备中,回声消除模块在进行回声消除时直接读取。设备频率响应曲线的确定方法为:获取待输出语音信号即将进入的传输/播放机构,以及待输出语音信号在进入播放机构前需要经过的所有传输机构,并将所有传输机构的增益均设置为1;将不同频率、相同幅度的扫频声输入即将进入的传输/播放机构,并使扫频声经过所有传输机构处理后输出至播放机构;录制播放机构播放的不同频率的扫频声,并根据所录制的扫频声确定当前待唤醒设备的测试频响曲线;获取当前待唤醒设备的预设设备频率响应曲线,并基于测试频响曲线调整所述预设设备频率响应曲线,使预设设备频率响应曲线逼近测试频响曲线以生成设备频率响应曲线。

可以理解的是,如果待输出语音信号是从语音传输路径末端,播放机构前所提取的语音信号,那么可以无需设置传输路径上各模块的增益,直接将该语音信号输出至播放机构;比如,如果待输出语音信号为系统模块输出的语音信号,那么该语音信号至少经过功放模块到达播放机构,此时,需要将功放模块的增益设置为1,然后将该语音信号输出至功放模块,再由功放模块输出至播放机构;如果待输出语音信号为功放模块输出的语音信号,那么直接将该语音信号输出至播放机构即可。

通常情况下,各个待唤醒设备之间的设备频率响应曲线均不同,即便是同一型号、同一批次的待唤醒设备的频响曲线也不完全相同,为了得到最好的回声消除效果,继而得到最佳的语音唤醒效果,特别是待唤醒设备所播放的播放信号与唤醒语音相似度较高时,原则上需要单独获取每个待唤醒设备的设备频率响应曲线。但可以理解的是,如果待唤醒设备所播放的语音与唤醒语音之间的差异较大,那么在语音唤醒时对于回声消除技术的依赖性会降低,此时同一型号或同一批次的待唤醒设备可以采用同一个设备频率响应曲线。

本发明提供的回声消除方法的技术方案,包括:获取待唤醒设备的待输出语音信号;根据待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。通过设备频率响应曲线与待输出语音信号,可以估计出待唤醒设备的播放机构所输出的播放信号,由于输出频响曲线引入了待唤醒设备的播放机构对待输出语音信号的影响,因此相对于现有技术仅基于待输出语音信号进行回声消除来说,可以大大提高回声消除效果,进而提高语音唤醒效果。

实施例二

图3是本发明实施例提供的回声消除装置的结构框图。该装置用于执行上述任意实施例所提供的回声消除方法,该装置可选为软件或硬件实现。该装置包括:

第一获取模块11,用于获取待唤醒设备的待输出语音信号;

唤醒语音确定模块12,用于根据待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。

本发明提供的回声消除装置的技术方案,通过获取模块获取待唤醒设备的待输出语音信号;通过唤醒语音确定模块根据待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。通过设备频率响应曲线与待输出语音信号,可以估计出待唤醒设备的播放机构所输出的播放信号,由于输出频响曲线引入了待唤醒设备的播放机构对待输出语音信号的影响,因此相对于现有技术仅基于待输出语音信号进行回声消除来说,可以大大提高回声消除效果,进而提高语音唤醒效果。

本发明实施例所提供的语音唤醒装置可执行本发明任意实施例所提供的语音唤醒方法,具备执行方法相应的功能模块和有益效果。

实施例三

图4是本发明实施例三提供的语音唤醒方法的流程图。本实施例的技术方案适用于提高语音唤醒成功率的情况。该方法可以采用软件和/或硬件的方式实现,并配置在系统模块中应用。该方法具体包括如下步骤:

s201、通过麦克风获取待唤醒设备的初始唤醒语音。

在对待唤醒设备进行语音唤醒时,回声消除模块需要先通过麦克风获取待唤醒设备的初始唤醒语音。比如,在对电视进行语音唤醒时,用户先对这麦克风说出唤醒语音,回声消除模块通过麦克获取包括唤醒语音、电视播放机构输出的播放信号在内的初始唤醒语音。

s202、根据初始唤醒语音和前述实施例所述的回声消除方法确定唤醒语音。

回声消除模块在获取到初始唤醒语音后,根据前述实施例所述的回声消除方法对初始唤醒语音进行回声消除处理,去除其中由播放信号所产生的回声信号,以得到唤醒语音。具体为:

回声消除模块在通过麦克风获取初始唤醒语音的同时,还获取待输出语音信号。其中,待输出语音信号为系统模块至播放机构的语音传输路径上的语音输出信号,比如系统模块输出的语音输出信号,或者功放模块输出的语音输出信号。

由于播放机构会对待输出语音信号产生影响,即播放机构播放出来的语音信号与播放前的语音信号的频率不相同,为此,本实施例引入设备频率响应曲线(参见图2),即通过设备频率响应曲线模拟待唤醒设备的播放机构对应待输出语音信号的影响,从而根据待输出语音信号与设备频率响应曲线估计出待唤醒设备的播放机构所输出的播放信号,即得到估计播放信号。其中,频率响应是指将一个以恒电压输出的音频信号与系统相连接时,音箱产生的声压随频率的变化而发生增大或衰减、相位随频率而发生变化的现象,这种声压和相位与频率的相关联的变化关系称为频率响应。

估计播放信号得到后,基于自适应滤波器,根据估计播放信号和初始唤醒信号确定回音信号;从初始语音唤醒信号中减去回音信号以生成唤醒语音。相较于自适应滤波器根据待输出语音信号和初始唤醒信号所确定的回音信号,本实施例的自适应滤波器根据估计播放信号和初始唤醒信号确定的回音信号更接近实际场景,因此初始唤醒语音中的播放信号去除的更加干净,所得到的唤醒语音更加纯净,可大大提高语音唤醒的成功率。

设备频率响应曲线通常需要通过测试手段获取,然后将其存储在待唤醒设备中,回声消除模块在进行回声消除时直接读取。设备频率响应曲线的确定方法为:获取待输出语音信号即将进入的传输/播放机构,以及待输出语音信号在进入播放机构前需要经过的所有传输机构,并将所有传输机构的增益均设置为1;将不同频率、相同幅度的扫频声输入即将进入的传输/播放机构,并使扫频声经过所有传输机构处理后输出至播放机构;录制播放机构播放的不同频率的扫频声,并根据所录制的扫频声确定当前待唤醒设备的测试频响曲线;获取当前待唤醒设备的预设设备频率响应曲线,并基于测试频响曲线调整所述预设设备频率响应曲线,使预设设备频率响应曲线逼近测试频响曲线以生成设备频率响应曲线。

可以理解的是,如果待输出语音信号是从语音传输路径末端,播放机构前所提取的语音信号,那么可以无需设置传输路径上各模块的增益,直接将该语音信号输出至播放机构;比如,如果待输出语音信号为系统模块输出的语音信号,那么该语音信号至少经过功放模块到达播放机构,此时,需要将功放模块的增益设置为1,然后将该语音信号输出至功放模块,再由功放模块输出至播放机构;如果待输出语音信号为功放模块输出的语音信号,那么直接将该语音信号输出至播放机构即可。

s203、根据唤醒语音确定启动信号,并通过启动信号启动待唤醒设备。

回声消除模块可通过usb或近场通信将唤醒语音输出至系统模块,系统模块根据唤醒语音确定启动信号,然后通过启动信号启动待唤醒设备。

本发明实施例提供的语音唤醒方法的技术方案,通过麦克风获取待唤醒设备的初始唤醒语音;根据初始唤醒语音和前述实施例所述的回声消除方法确定唤醒语音;根据唤醒语音确定启动信号,并通过启动信号启动待唤醒设备。由于前述实施例的回声消除方法可以得到非常纯净的唤醒语音,因此可以根据唤醒语音准确地确定启动信号,可以保证语音唤醒具有较高的成功率。

实施例四

图5是本发明实施例四提供的语音唤醒设备的结构框图。该设备包括:第二获取模块2、回声消除模块1和系统模块3,第二获取模块2用于通过麦克风获取待唤醒设备初始语音唤醒信号;回声消除模块1用于根据前述实施例所述的回声消除方法和初始语音唤醒信号确定语音唤醒信号;系统模块3用于根据唤醒语音确定启动信号,并根据启动信号启动待唤醒设备。

其中,本实施例的回声消除模块1为集成有回声消除算法的芯片,比如dsp(digitalsignalprocessing,简称dsp)、fpga(field-programmablegatearray,简称fpga)等,回声消除模块1确定语音唤醒信号的具体过程参见前述实施例,本实施例在此不予赘述。

本发明实施例提供的语音唤醒设备的技术方案,基于语音获取模块通过麦克风获取待唤醒设备的初始唤醒语音;通过回声消除模块根据初始唤醒语音和前述实施例所述的回声消除方法确定唤醒语音;通过系统模块根据唤醒语音确定启动信号,并通过启动信号启动待唤醒设备。由于前述实施例的回声消除方法可以得到非常纯净的唤醒语音,因此可以根据唤醒语音准确地确定启动信号,可以保证语音唤醒具有较高的成功率。

实施例五

本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种回声消除方法,该方法包括:

获取待唤醒设备的待输出语音信号;

根据待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的回声消除方法中的相关操作。

通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-onlymemory,简称rom)、随机存取存储器(randomaccessmemory,简称ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的回声消除方法。

值得注意的是,上述回声消除装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1