一种音频数据与参考信号的时间对齐方法及装置的制造方法_3

文档序号:8925373阅读:来源:国知局
的采集时间,从参考队列中选择一参考信号,根据选择的 参考信号消除该音频数据d(n)中的回声。
[0076] 当麦克风再次采集到音频数据时,从上述步骤201开始执行。
[0077] 其中,需要说明的是;麦克风是一帖一帖地采集音频数据,一帖音频数据的大小可 W根据需要设定,帖越大,整个参考队列所能表示的时间范围Tm"也越大但是时间精度AT 变小,反之则时间精度AT得W提高,但是最大捜索时间范围Tm。湘应地缩小,用公式表示 该个约束关系就是:
[007引Tmax=AT.L
[0079]
[0080] 其中,B表示每帖音频数据中所包含的采样点数,L表示参考队列的长度,fs表示 音频采样频率。在本发明实施例中,可W设置fs= 16曲z,B= 64,L= 200,对应的时间精 度为4ms,最大捜索时间范围Tm"为800ms。
[0081] 对于公式(2)中的数据块长度B和音频采样率fs的选取,除了上述方案中所列 出的具体数值,还可W取其他的值。具体而言,音频采样率fs可W在8000化,16000化, 22050化,24000化,44100化和48000曲Z该几个常用值中选取;数据块长度B可W在32,64, 128和256该几个常用值中选取。不同的B和fs的组合所对应的时间精度AT不同,时间 精度AT过低会使得系统的准确性降低,反之时间精度AT过高会带来计算量的增加。几 种常用的参数组合所对应的单步时间精度如表(1)所示。
[0082] 表 1
[0083]
[0084] 对于公式(2)中的参考队列长度L的选取,考虑到音频数据存在周期相关性,因此 L的取值并非越大越好,根据实践经验,L的合理取值范围为1~0. 8 ?fs/B,当L取值超过 此范围时系统的工作开始趋于不稳定。
[0085] 在本发明实施例中,由于根据第二延时估计期望值和第一延时估计期望值能够检 测出该音频数据与参考队列中的参考信号之间是否存在差拍现象,从而在一出现差拍现象 便能被检测出,然后对齐该音频数据与参考队列中的参考信号之间的时间关系,W消除该 差拍现象,从而使得终端逐渐恢复消除音频数据中的回声,提高了回声消除的鲁椿性。另 夕F,在检测差拍之前,还根据第一延时估计期望值T化),确定该音频数据d(n)是否包括本 端用户声音,在不包括本端用户声音的情况下进行差拍现象的检测,提高了检测精度。
[0086] 实施例3
[0087] 参见图3,本发明实施例提供了一种音频数据与参考信号的时间对齐装置,包括:
[008引获取模块301,用于获取当前采集的音频数据W及从参考队列中获取所述音频数 据对应的参考信号;
[0089] 计算模块302,用于根据所述音频数据和所述参考信号之间的相关值,计算第一延 时估计期望值;
[0090] 检测模块303,用于根据第二延时估计期望值和所述第一延时估计期望值检测所 述音频数据与所述参考队列中的参考信号之间是否存在差拍现象,所述第二延时估计期望 值是在当前之前最近一次计算得到的延时估计期望值;
[0091] 对齐模块304,用于如果存在,则对齐所述音频数据与所述参考队列中的参考信号 之间的时间关系。
[0092] 可选的,所述检测模块303包括:
[0093] 比较单元,用于比较第二延时估计期望值和所述第一延时估计期望值;
[0094] 检测单元,用于如果两者不等,则检测出所述音频数据与所述参考队列中的参考 信号之间存在差拍现象。
[00巧]可选的,所述对齐模块304包括:
[0096] 第一停止单元,用于如果所述第一延时估计期望值小于所述第二延时估计期望 值,则停止向所述参考队列输入参考信号并继续向回声消除模块输入采集的音频数据,W 对齐所述音频数据与所述参考队列中的参考信号之间的时间关系;
[0097] 第二停止单元,用于如果所述第一延时估计期望值大于所述第二延时估计期望 值,则停止向所述回声消除模块输入采集的音频数据并继续向所述参考队列输入参考信 号,W对齐所述音频数据与所述参考队列中的参考信号之间的时间关系。
[0098] 进一步地,所述装置还包括:
[0099] 输入模块,用于如果不存在差拍现象,则继续向所述参考队列输入参考信号W及 继续向所述回声消除模块输入采集的音频数据。
[0100] 可选的,所述计算模块302包括:
[0101] 第一确定单元,用于将所述音频数据与所述参考信号之间的相关值确定为所述音 频数据的延时估计;
[0102] 第一获取单元,用于获取在第一时间段内采集的各音频数据的延时估计,所述第 一时间段是在当前之前且离当前最近的预设时间长度的时间段;
[0103] 第一计算单元,用于根据所述音频数据的延时估计和所述第一时间段内采集的各 音频数据的延时估计,计算第一延时估计期望值。
[0104] 进一步地,所述装置还包括:
[01化]确定模块,用于根据所述第一延时估计期望值,确定所述音频数据中是否包括本 端用户声音,如果不包括,则执行所述根据第二延时估计期望值和所述第一延时估计期望 值检测所述音频数据与所述参考队列之间是否存在差拍现象的操作。
[0106] 可选的,所述确定模块包括:
[0107] 第二计算单元,用于根据所述第一延时估计期望值和所述第二延时估计期望值, 计算第一延时估计一阶差分值;
[0108] 第二获取单元,用于获取在第一时间段内计算得到的第二延时估计一阶差分值, 所述第一时间段是在当前之前且离当前最近的预设时间长度的时间段;
[0109] 第=计算单元,用于根据所述第一延时估计一阶差分值和所述第二延时估计一阶 差分值,计算延时估计稳定度指标;
[0110] 第二确定单元,用于如果所述延时估计稳定度指标小于预设阔值,则确定所述音 频数据不包括本端用户声音。
[0111] 进一步地,所述装置还包括:
[0112] 消除模块,用于根据所述第一延时估计期望值消除所述音频数据中的回声。
[0113] 在本发明实施例中,由于根据第二延时估计期望值和第一延时估计期望值能够检 测出该音频数据与参考队列中的参考信号之间是否存在差拍现象,从而在一出现差拍现象 便能被检测出,然后对齐该音频数据与参考队列中的参考信号之间的时间关系,W消除该 差拍现象,从而使得终端逐渐恢复消除音频数据中的回声,提高了回声消除的鲁椿性。
[0114] 实施例4
[0115] 参见图4,其示出了本发明实施例所设及的终端结构示意图,用于实施上述实施例 中提供的一种音频数据与参考信号的时间对齐方法。具体来讲:
[0116] 终端900可w包括RF(Radio化equen巧,射频)电路110、包括有一个或一个W上 计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、 WiFi(wirelessfidelity,无线保真)模块170、包括有一个或者一个W上处理核屯、的处理 器180、W及电源190等部件。本领域技术人员可W理解,图4中示出的终端结构并不构成 对终端的限定,可W包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布 置。其中:
[0117]RF电路110可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站 的下行信息接收后,交由一个或者一个W上处理器180处理;另外,将设及上行的数据发 送给基站。通常,RF电路110包括但不限于天线、至少一个放大器、调谐器、一个或多个 振荡器、用户身份模块(SIM)卡、收发信机、禪合器、LNA(LowNoiseAmplifier,低噪声放 大器)、双工器等。此外,RF电路110还可W通过无线通信与网络和其他设备通信。所述 无线通信可W使用任一通信标准或协议,包括但不限于GSM(GlobalSystemofMobile communication,全球移动通讯系统)、GPRS(GeneralPacketRadioService,通用分组 无线服务)、CDMA(CodeDivisionMultipleAccess,码分多址)、WCDMA(WidebandCode DivisionMultipleAccess,宽带码分多址)、LTE(X〇ngTermEvolution,长期演进)、电 子邮件、SMS(化ortMessagingService,短消息服务)等。
[0118] 存储器120可用于存储软件程序W及模块,处理器180通过运行存储在存储器120 的软件程序W及模块,从而执行各种功能应用W及数据处理。存储器120可主要包括存 储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序 (比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端900的使用所创
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1