音频信号处理方法、装置、电子设备及计算机可读介质与流程

文档序号:21021522发布日期:2020-06-09 19:43阅读:184来源:国知局
音频信号处理方法、装置、电子设备及计算机可读介质与流程

本公开实施例涉及音频信号技术领域,特别涉及音频信号处理方法、装置、电子设备及计算机可读介质。



背景技术:

随着智能语音技术的发展,使得智能语音技术的应用越来越广泛。当智能语音技术赋能于wifi音箱时,产生了智能wifi音箱。当智能语音技术赋能于蓝牙音箱时,产生了智能蓝牙音箱。但是,传统的智能蓝牙音箱只作为播放设备,无法进行语音交互,即只能接收手机等智能设备的下行数据,需要额外设置蓝牙语音设备才能实现数据上行。例如,车载蓝牙音箱作为一种播放设备,仅能播放手机发送的音频信号,并不能与手机进行语音交互。因此,车辆上还配置有蓝牙语音设备,借助蓝牙语音设备录入交互语音信息。

公开内容

本公开实施例提供一种音频信号处理方法、装置、电子设备、计算机可读介质。

第一方面,本公开实施例提供一种音频信号处理方法,其包括:

获取音频数据;其中,所述音频数据是播放设备播放的数据;

获取语音信息;其中,所述语音信息包括交互语音信息和播放语音信息,所述播放语音信息是所述播放设备播放所述音频数据时产生的语音信息;

基于所述音频数据对所述语音信息进行回声消除处理,得到所述交互语音信息。

在一些实施例中,所述音频数据与所述播放设备的所述音频数据同步获得。

在一些实施例中,所述获取所述音频数据,包括:

接收所述音频数据;

向所述播放设备传送所述音频数据,以供所述播放设备播放所述音频数据。

在一些实施例中,利用所述音频数据的来源设备配置所述播放设备,以与所述播放设备建立信号连接。

在一些实施例中,所述基于所述音频数据对所述语音信息进行回声消除处理,得到所述交互语音信息之后,还包括:

将回声消除处理后得到的所述交互语音信息上传至所述音频数据的来源设备。

在一些实施例中,所述基于所述音频数据对所述语音信息进行回声消除处理,得到所述交互语音信息之后,还包括:

对所述交互语音信息和所述音频数据进行混频处理,得到混频信息;

将所述混频信息向外广播。

第二方面,本公开实施例提供一种音频信号处理装置,其包括:

数据接收模块,用于获取音频数据;其中,所述音频数据是播放设备播放的数据;

语音录入模块,用于获取语音信息;其中,所述语音信息包括交互语音信息和播放语音信息,所述播放语音信息是所述播放设备播放所述音频数据时产生的语音信息;

回声消除模块,用于基于所述音频数据对所述语音信息进行回声消除处理,得到处理后的交互语音信息。

在一些实施例中,所述数据接收模块与所述播放设备同步获得所述音频数据。

在一些实施例中,所述装置还包括:

第一数据发送模块,用于向所述播放设备传送所述音频数据,以供所述播放设备播放所述音频数据。

在一些实施例中,所述装置还包括:

第二数据发送模块,用于将回声消除处理后得到的所述交互语音信息上传至所述音频数据的来源设备。

在一些实施例中,所述装置还包括:

混频模块,用于对所述交互语音信息和所述音频数据进行混频处理,得到混频信息。

第三方面,本公开实施例提供一种电子设备,其包括:

一个或多个处理器;

存储器,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器上述任意一种音频信号处理方法;

一个或多个i/o接口,连接在所述处理器与存储器之间,配置为实现所述处理器与存储器的信息交互。

第四方面,本公开实施例提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任意一种音频信号处理的方法。

本公开实施例提供的音频信号处理方法,利用播放设备播放的音频数据作为消除回声的参考信号,将语音信息中的播放语音信息消除,获得了干净的交互语音信息,从而提高语音交互效果。

附图说明

附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其它特征和优点对本领域技术人员将变得更加显而易见,在附图中:

图1为本公开实施例提供的音频信号处理方法的应用场景示意图;

图2为本公开实施例提供的一种音频信号处理方法的流程图;

图3为本公开实施例提供的另一种音频信号处理方法的流程图;

图4为本公开实施例提供的音频信号处理方法的应用场景示意图;

图5为本公开实施例提供的一种音频信号处理装置的示例性框图;

图6为本公开实施例提供的另一音频信号处理装置的示例性框图;

图7为本公开实施例提供的一种电子设备的组成框图。

具体实施方式

为使本领域的技术人员更好地理解本公开的技术方案,下面结合附图对本公开提供的音频信号处理方法、装置、电子设备、计算机可读介质进行详细描述。

在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。

在不冲突的情况下,本公开各实施例及实施例中的各特征可相互组合。

如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。

本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组件和/或其群组。

除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。

本实施例是针对蓝牙音箱和蓝牙语音设备在配合使用时,蓝牙语音设备在获取交互语音信息时,不可避免地录入蓝牙音箱播放的播放语音信息,播放语音信息对交互语音信息造成干扰,为了降低播放语音信息对交互语音信息的干扰,需要通过回声消除处理将播放语音信息消除,但目前的回声消除处理并不理想,无法获得干净的交互语音信息,从而严重影响蓝牙语音设备的交互效果。

图1为本公开实施例中音频信号处理方法的应用场景示意图。如图1所示,蓝牙音箱101和蓝牙麦克风102均与音频数据来源设备103信号连接,而且蓝牙音箱101和蓝牙麦克风102均能接收音频数据来源设备103下发的音频数据。蓝牙音箱101用于播放音频数据,蓝牙麦克风102与音频数据来源设备103进行语音交互。蓝牙麦克风102在获得交互语音信息时,不可避免的获得蓝牙音箱101播放的播放语音信息。为了降低播放语音信息对蓝牙麦克风102上传给音频数据来源设备103的交互信息的影响,提出本公开实施例的音频信号处理方法。

在一些实施例中,蓝牙音箱101和蓝牙麦克风102可以应用于车辆,蓝牙音箱101为车载蓝牙音箱,蓝牙麦克风102为车载蓝牙麦克风。蓝牙音箱101和蓝牙麦克风102还可以应用于卡拉ok,提高卡拉ok的娱乐效果,从而提高客户满意度。

需要说明的是,在本实施例中蓝牙音箱101作为播放设备,也可以采用如wifi音箱等其他播放设备。蓝牙麦克风102作为语音设备,也可以采用如wifi麦克风等其他录音设备。手机103作为音频数据的来源设备,也可以采用如ipad等其他音频数据设备。

第一方面,本公开实施例提供一种音频信号处理方法,图2为本公开实施例提供的一种音频信号处理方法的流程图。

参照图2,本公开实施例提供的音频信号处理方法,其包括:

201,获取音频数据。

其中,音频数据是播放设备播放的数据。

在一些实施例中,音频数据是由手机103发出的数据,蓝牙麦克风102和蓝牙音箱101同步获得该音频数据,使蓝牙麦克风102获得了与蓝牙音箱101相同的音频数据。

202,获取语音信息。

其中,语音信息包括交互语音信息和播放语音信息。在一些实施例中,交互语音信息是蓝牙麦克风102上传给手机103的语音信息。播放语音信息是蓝牙音箱101播放音频数据时产生的语音信息。例如,当蓝牙音箱101播放歌曲时,歌曲的声音为播放语音信息。

203,基于音频数据对语音信息进行回声消除处理,得到交互语音信息。

蓝牙麦克风102利用手机103传送的音频数据作为消除回声的参考信号,对语音信息进行处理,过滤掉蓝牙音箱101在播放音频数据过程中产生的播放语音信息,获得干净的交互语音信息。

在一些实施例中,通过音频信号处理方法获得干净的交互语音信息后,还进一步包括:蓝牙麦克风102将干净的交互语音信息上传至手机103,手机103获得干净的交互语音信息后,进行相应的操作。

在一些实施例中,通过音频信号处理方法获得干净的交互语音信息后,还进一步包括:

蓝牙麦克风102对交互语音信息和音频数据进行混频处理,得到混频信息,然后将混频信息向外广播。蓝牙音箱101可以播放该混频信息。例如,蓝牙麦克风102获得的交互语音信息为歌声,音频数据为音乐,蓝牙麦克风102将歌声和音乐混频后,发送至蓝牙音箱101,再由蓝牙音箱101播放。

图3为本公开实施例提供的另一种音频信号处理方法的流程图。图4为该音频信号处理方法对应的应用场景示意图。参照图3和图4,本公开实施例提供的音频信号处理方法,其包括:

301,获取音频数据。

其中,音频数据是播放设备播放的数据。

在一些实施例中,音频数据是由手机403发出的数据。蓝牙麦克风402获取音频数据,然后将该音频数据发送至蓝牙音箱401。

不难理解,蓝牙麦克风402作为中继设备,将手机403传送的音频数据转发至蓝牙音箱401,显然蓝牙麦克风402获得了蓝牙音箱401播放的音频数据。

在一些实施例中,蓝牙麦克风402借助手机401与蓝牙音箱401建立信号连接,即,蓝牙麦克风402与手机401建立信号连接后,通过手机403设置,以使蓝牙麦克风402和蓝牙音箱401信号连接。

302,将音频数据发送至蓝牙音箱。

蓝牙麦克402将获得的音频数据发送至蓝牙音箱401,即,蓝牙音箱401并不是直接从手机403获得的音频数据,而是通过蓝牙麦克风402获得。

303,获取语音信息。

其中,语音信息包括交互语音信息和播放语音信息,在一些实施例中,交互语音信息是蓝牙麦克风402上传给手机403的语音信息。播放语音信息是蓝牙音箱401播放音频数据时产生的语音信息。例如,当蓝牙音箱401播放歌曲时,歌曲的声音为播放语音信息。

304,基于音频数据对语音信息进行回声消除处理,得到交互语音信息。

蓝牙麦克风402利用手机403传送的音频数据作为消除回声的参考信号,对语音信息进行处理,过滤掉蓝牙音箱401在播放音频数据过程中产生的播放语音信息,获得干净的交互语音信息。

在一些实施例中,通过音频信号处理方法获得干净的交互语音信息后,还进一步包括:蓝牙麦克风402将干净的交互语音信息上传至手机403,手机403获得干净的交互语音信息后,进行相应的操作。

在一些实施例中,通过音频信号处理方法获得干净的交互语音信息后,还进一步包括:

蓝牙麦克风402对交互语音信息和音频数据进行混频处理,得到混频信息,然后将混频信息向外广播。蓝牙音箱401可以播放该混频信息。例如,蓝牙麦克风402获得的交互语音信息为歌声,音频数据为音乐,蓝牙麦克风402将歌声和音乐混频后,发送至蓝牙音箱401,再由蓝牙音箱401播放。

本公开实施例提供的音频信号处理方法,利用播放设备播放的音频数据作为消除回声的参考信号,将语音信息中的播放语音信息消除,获得了干净的交互语音信息,从而提高语音交互效果。

第二方面,本公开实施例提供一种音频信号处理装置,该音频信号处理装置可以是麦克风或其他智能装置。

图5为本公开实施例提供的一种音频信号处理装置的示例性框图。参照图5,本公开实施例提供的音频信号处理装置包括:

数据接收模块501,用于获取音频数据。其中,音频数据是播放设备播放的数据。

在一些实施例中,音频数据来自于手机等音频数据的来源设备。数据接收模块501与播放设备同步接收音频数据。在一些实施例中,数据接收模块501可以是蓝牙数据接收模块或wifi数据接收模块。

语音录入模块502,用于获取语音信息。其中,语音信息包括交互语音信息和播放语音信息,播放语音信息是播放设备播放音频数据时产生的语音信息。

在一些实施例中,播放设备可以但不限于蓝牙音箱、wifi音箱等具有发声能力的扬声器。

回声消除模块503,用于基于音频数据对语音信息进行回声消除处理,得到处理后的交互语音信息。

回声消除模块503利用手机传送的音频数据作为消除回声的参考信号,对语音信息进行处理,过滤掉播放设备在播放音频数据过程中产生的播放语音信息,获得干净的交互语音信息。

在一些实施例中,数据接收模块501与播放设备同步获得音频数据。

图6为本公开实施例提供的另一音频信号处理装置的示例性框图。参照图6,本公开实施例提供的音频信号处理装置包括:数据接收模块601、语音录入模块602和回声消除模块603,而且,数据接收模块601、语音录入模块602和回声消除模块603的作用和连接方式与上述实施例相同,在此不再赘述。

音频信号处理装置还包括第一数据发送模块604,用于音频数据传送至播放设备,以供播放设备播放音频数据。音频信号处理装置借助数据接收模块501获取音频数据,并借助第一数据发送模块604向播放设备传送音频数据。

在一些实施例中,音频信号处理装置还包括第二数据发送模块605,用于将回声消除处理后得到的交互语音信息上传至音频数据的来源设备。

在一些实施例中,音频信号处理装置还包括混频模块606,用于对交互语音信息和音频数据进行混频处理,得到混频信息。混频模块606获得混频信息后,可以借助第一数据发送模块604将混频信息发送至蓝牙音箱等播放设备;和/或,借助第二数据发送模块605将混频信息上传至手机等音频数据的来源设备。

需要说明的是,当音频信号处理装置设置混频模块606时,音频信号处理装置具备了卡拉ok的功能。由于混频模块606可以直接将交互语音信息和音频数据混频,避免了播放语音信息传输延时过大和不稳定的缺陷,而且回声消除效果好,提高了音频信号处理装置的性能。

本公开实施例提供的音频信号处理装置,数据接收模块获得了与播放设备相同的音频信息,当语音录入模块获取语音信息后,回声消除模块利用音频数据作为消除回声的参考信号,将语音信息中的播放语音信息消除,获得了干净的交互语音信息,从而提高音频信号处理装置的语音交互效果。

第三方面,参照图7,本公开实施例提供一种电子设备,其包括:

一个或多个处理器701;

存储器702,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述任意一项的音频信号处理方法;

一个或多个i/o接口703,连接在处理器与存储器之间,配置为实现处理器与存储器的信息交互。

其中,处理器701为具有数据处理能力的器件,其包括但不限于中央处理器(cpu)等;存储器702为具有数据存储能力的器件,其包括但不限于随机存取存储器(ram,更具体如sdram、ddr等)、只读存储器(rom)、带电可擦可编程只读存储器(eeprom)、闪存(flash);i/o接口(读写接口)703连接在处理器701与存储器702间,能实现处理器701与存储器702的信息交互,其包括但不限于数据总线(bus)等。

在一些实施例中,处理器701、存储器702和i/o接口703通过总线704相互连接,进而与计算设备的其他组件连接。

第四方面,本公开实施例提供一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现上述任意一种音频信号处理方法。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其它数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其它存储器技术、cd-rom、数字多功能盘(dvd)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其它的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其它传输机制之类的调制数据信号中的其它数据,并且可包括任何信息递送介质。

本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其它实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1