方向滤波器的生成方法、音频处理方法、装置及存储介质与流程

文档序号:30418210发布日期:2022-06-15 12:12阅读:580来源:国知局
方向滤波器的生成方法、音频处理方法、装置及存储介质与流程

1.本公开涉及音频处理技术领域,尤其涉及一种方向滤波器的生成方法、音频处理方法、装置及存储介质。


背景技术:

2.近年来,三维空间音频受到广泛关注,而其中空间音频的方向特性依赖于头部相关传递函数(head related transfer functions,hrtf)数据库中存储的数据,该数据描述了在自由场中从声源到耳道中的声音传输特性。当音频播放设备发出声音时,该声音以声波的形式在空间中向各个方向传播。声波从声源向四面八方扩散开来,就像一个球体。头部的大小、肩部的宽窄,耳朵的形状、耳道的长度和直径以及口腔和鼻窦腔的尺寸都会影响声波从许多不同的方向到达听者时某些频率的增益和衰减,因此不同角度传来的声波到达耳朵时都有不同的特性,该特性可以为听众创造独特而真实的听感,从而有助于听者精确定位声源的位置。由于hrtf数据库中包含了个体对应确定声源位置所建模的信息,因此该数据库在空间音频(实现三维声像)相关应用中十分重要。


技术实现要素:

3.为克服相关技术中存在的问题,本公开提供一种方向滤波器的生成方法、音频处理方法、装置及存储介质。
4.根据本公开实施例的第一方面,提供一种方向滤波器的生成方法,包括:
5.根据初始头部相关传递函数数据库,确定与每一声源角度对应的第一冲激响应;其中,所述初始头部相关传递函数数据库中存储有多个初始头部相关传递函数,每个所述初始头部相关传递函数用于表示一个声源角度和与所述声源角度对应的第一冲激响应的函数关系;
6.根据所述第一冲激响应,确定与每一声源角度对应的目标系统频率响应;
7.构建初始的每一声源角度对应的方向滤波器,且所述方向滤波器共用预设的极点参数;
8.针对每一声源角度,根据单位冲激函数、所述声源角度对应的目标系统频率响应和初始的所述声源角度对应的方向滤波器,生成所述声源角度对应的方向滤波器。
9.可选地,所述针对每一声源角度,根据单位冲激函数、所述声源角度对应的目标系统频率响应和初始的所述声源角度对应的方向滤波器,生成所述声源角度对应的方向滤波器,包括:
10.针对每一声源角度,将单位冲激函数输入初始的所述声源角度对应的方向滤波器,得到所述声源角度对应的第二冲激响应;
11.根据所述声源角度对应的第二冲激响应和所述声源角度对应的目标系统频率响应,确定所述声源角度对应的方向滤波器的相关参数;
12.根据所述相关参数和所述预设的极点参数,生成所述声源角度对应的方向滤波
器。
13.可选地,所述根据所述声源角度对应的第二冲激响应和所述声源角度对应的目标系统频率响应,确定所述声源角度对应的方向滤波器的相关参数,包括:
14.将所述声源角度对应的第二冲激响应转换为所述声源角度对应的第一系统频率响应;
15.通过以下公式,确定所述声源角度对应的第一系统频率响应与所述声源角度对应的目标系统频率响应之间的平方误差:
[0016][0017]
其中,表征声源角度对应的第一系统频率响应与声源角度对应的目标系统频率响应之间的平方误差,n表征所述第一系统频率响应的长度,表征声源角度对应的第一系统频率响应,表征声源角度对应的目标系统频率响应,θ表征声源角度中的俯仰角,表征声源角度中的水平角;
[0018]
根据所述平方误差,确定所述声源角度对应的方向滤波器的相关参数。
[0019]
可选地,所述方向滤波器包括k个并联结构的二阶基本节零极点滤波器和l+1阶全零点滤波器,且k为大于1的整数,l为大于0的整数。
[0020]
可选地,所述方向滤波器共用的极点参数包括第一阶极点参数和第二阶极点参数;所述方向滤波器的z域系统传递函数满足如下公式:
[0021][0022]
其中,表征声源角度对应的方向滤波器的z域系统传递函数,分别表征声源角度对应的方向滤波器中第k个二阶基本节零极点滤波器中的第一增益系数、第二增益系数,a
1,k(z)
、a
2,k(z)
分别表征声源角度对应的方向滤波器中第k个二阶基本节零极点滤波器中第一阶极点参数、第二阶极点参数,表征第l阶全零点滤波器中的增益系数。
[0023]
可选地,采用对数尺度设置所述方向滤波器共用的极点参数。
[0024]
可选地,所述根据所述第一冲激响应,确定与每一声源角度对应的目标系统频率响应,包括:
[0025]
将所述第一冲激响应转换为每一声源角度对应的第二系统频率响应;
[0026]
确定所述第二系统频率响应的失真频段,以及,根据所述失真频段和预设的均衡器,生成每一声源角度对应的新的冲激响应;
[0027]
将所述每一声源角度对应的新的冲激响应转换为每一声源角度对应的新的系统频率响应,并将所述每一声源角度对应的新的系统频率响应确定为每一声源角度对应的目标系统频率响应。
[0028]
根据本公开实施例的第二方面,提供一种音频处理方法,应用于头戴式音频播放设备,所述头戴式音频播放设备包括扬声器和陀螺仪,所述方法包括:
[0029]
获取待输入所述扬声器的第一双通道音频信号;
[0030]
在获取所述第一双通道音频信号的同时或前后预定时间内,获取所述陀螺仪的采集数据;
[0031]
基于采集数据得到佩戴所述头戴式音频播放设备的用户的头部角度信息,并将所述头部角度信息确定为所述第一双通道音频信号的声源角度;
[0032]
在预设的滤波器数据库中查找与所述声源角度对应的方向滤波器,其中,所述滤波器数据库中包括多个声源角度,每个声源角度有对应的方向滤波器;以及,所述的滤波器数据库中的方向滤波器采用本公开第一方面中任一项所述的方法生成;
[0033]
根据所述方向滤波器对所述第一双通道音频信号进行滤波处理,得到第二双通道音频信号,其中,所述第二双通道音频信号具有方向感;
[0034]
将所述第二双通道音频信号输入至所述扬声器,以由所述扬声器播放。
[0035]
根据本公开实施例的第三方面,提供一种方向滤波器的生成装置,包括:
[0036]
第一确定模块,被配置为根据初始头部相关传递函数数据库,确定与每一声源角度对应的第一冲激响应;其中,所述初始头部相关传递函数数据库中存储有多个初始头部相关传递函数,每个所述初始头部相关传递函数用于表示一个声源角度和与所述声源角度对应的第一冲激响应的函数关系;
[0037]
第二确定模块,被配置为根据所述第一冲激响应,确定与每一声源角度对应的目标系统频率响应;
[0038]
构建模块,被配置为构建初始的每一声源角度对应的方向滤波器,且所述方向滤波器共用预设的极点参数;
[0039]
生成模块,被配置为针对每一声源角度,根据单位冲激函数、所述声源角度对应的目标系统频率响应和初始的所述声源角度对应的方向滤波器,生成所述声源角度对应的方向滤波器。
[0040]
可选地,所述生成模块包括:
[0041]
输入子模块,被配置为针对每一声源角度,将单位冲激函数输入初始的所述声源角度对应的方向滤波器,得到所述声源角度对应的第二冲激响应;
[0042]
第一确定子模块,被配置为根据所述声源角度对应的第二冲激响应和所述声源角度对应的目标系统频率响应,确定所述声源角度对应的方向滤波器的相关参数;
[0043]
第一生成子模块,被配置为根据所述相关参数和所述预设的极点参数,生成所述声源角度对应的方向滤波器。
[0044]
可选地,所述第一确定子模块包括:
[0045]
转换子模块,被配置为将所述声源角度对应的第二冲激响应转换为所述声源角度对应的第一系统频率响应;
[0046]
第二确定子模块,被配置为通过以下公式,确定所述声源角度对应的第一系统频率响应与所述声源角度对应的目标系统频率响应之间的平方误差:
[0047][0048]
其中,表征声源角度对应的第一系统频率响应与声源角度对应的目标系统频率响应之间的平方误差,n表征所述第一系统频率响应的长度,
表征声源角度对应的第一系统频率响应,表征声源角度对应的目标系统频率响应,θ表征声源角度中的俯仰角,表征声源角度中的水平角;
[0049]
第三确定子模块,被配置为根据所述平方误差,确定所述声源角度对应的方向滤波器的相关参数。
[0050]
可选地,所述方向滤波器包括k个并联结构的二阶基本节零极点滤波器和l+1阶全零点滤波器,且k为大于1的整数,l为大于0的整数。
[0051]
可选地,所述方向滤波器共用的极点参数包括第一阶极点参数和第二阶极点参数;所述方向滤波器的z域系统传递函数满足如下公式:
[0052][0053]
其中,表征声源角度对应的方向滤波器的z域系统传递函数,分别表征声源角度对应的方向滤波器中第k个二阶基本节零极点滤波器中的第一增益系数、第二增益系数,a
1,k(z)
、a
2,k(z)
分别表征声源角度对应的方向滤波器中第k个二阶基本节零极点滤波器中第一阶极点参数、第二阶极点参数,表征第l阶全零点滤波器中的增益系数。
[0054]
可选地,采用对数尺度设置所述方向滤波器共用的极点参数。
[0055]
可选地,所述第二确定模块包括:
[0056]
转换子模块,被配置为将所述第一冲激响应转换为每一声源角度对应的第二系统频率响应;
[0057]
第二生成子模块,被配置为确定所述第二系统频率响应的失真频段,以及,根据所述失真频段和预设的均衡器,生成每一声源角度对应的新的冲激响应;
[0058]
第四确定子模块,被配置为将所述每一声源角度对应的新的冲激响应转换为每一声源角度对应的新的系统频率响应,并将所述每一声源角度对应的新的系统频率响应确定为每一声源角度对应的目标系统频率响应。
[0059]
根据本公开实施例的第四方面,提供一种音频处理装置,应用于头戴式音频播放设备,所述头戴式音频播放设备包括扬声器和陀螺仪,所述装置包括:
[0060]
第一获取模块,被配置为获取待输入所述扬声器的第一双通道音频信号;
[0061]
第二获取模块,被配置为在获取所述第一双通道音频信号的同时或前后预定时间内,获取所述陀螺仪的采集数据;
[0062]
第三获取模块,被配置为基于采集数据得到佩戴所述头戴式音频播放设备的用户的头部角度信息,并将所述头部角度信息确定为所述第一双通道音频信号的声源角度;
[0063]
查找模块,被配置为在预设的滤波器数据库中查找与所述声源角度对应的方向滤波器,其中,所述滤波器数据库中包括多个声源角度,每个声源角度有对应的方向滤波器;以及,所述的滤波器数据库中的方向滤波器采用本公开第一方面中任一项所述的方法生成;
[0064]
处理模块,被配置为根据所述方向滤波器对所述第一双通道音频信号进行滤波处理,得到第二双通道音频信号,其中,所述第二双通道音频信号具有方向感;
[0065]
输入模块,被配置为将所述第二双通道音频信号输入至所述扬声器,以由所述扬声器播放。
[0066]
根据本公开实施例的第五方面,提供一种方向滤波器的生成装置,包括:
[0067]
处理器;
[0068]
用于存储处理器可执行指令的存储器;
[0069]
其中,所述处理器被配置为:
[0070]
根据初始头部相关传递函数数据库,确定与每一声源角度对应的第一冲激响应;其中,所述初始头部相关传递函数数据库中存储有多个初始头部相关传递函数,每个所述初始头部相关传递函数用于表示一个声源角度和与所述声源角度对应的第一冲激响应的函数关系;
[0071]
根据所述第一冲激响应,确定与每一声源角度对应的目标系统频率响应;构建初始的每一声源角度对应的方向滤波器,且所述方向滤波器共用预设的极点参数;
[0072]
针对每一声源角度,根据单位冲激函数、所述声源角度对应的目标系统频率响应和初始的所述声源角度对应的方向滤波器,生成所述声源角度对应的方向滤波器。
[0073]
根据本公开实施例的第六方面,提供一种音频处理装置,包括:
[0074]
处理器;
[0075]
用于存储处理器可执行指令的存储器;
[0076]
其中,所述处理器被配置为:
[0077]
获取待输入所述扬声器的第一双通道音频信号;
[0078]
在获取所述第一双通道音频信号的同时或前后预定时间内,获取所述陀螺仪的采集数据;
[0079]
基于采集数据得到佩戴所述头戴式音频播放设备的用户的头部角度信息,并将所述头部角度信息确定为所述第一双通道音频信号的声源角度;
[0080]
在预设的滤波器数据库中查找与所述声源角度对应的方向滤波器,其中,所述滤波器数据库中包括多个声源角度,每个声源角度有对应的方向滤波器;以及,所述的滤波器数据库中的方向滤波器采用本公开第一方面中任一项所述的方法生成;
[0081]
根据所述方向滤波器对所述第一双通道音频信号进行滤波处理,得到第二双通道音频信号,其中,所述第二双通道音频信号具有方向感;
[0082]
将所述第二双通道音频信号输入至所述扬声器,以由所述扬声器播放。
[0083]
根据本公开实施例的第七方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的方向滤波器的生成方法或者实现本公开第二方面所提供的音频处理方法的步骤。
[0084]
本公开的实施例提供的技术方案可以包括以下有益效果:
[0085]
采用上述技术方案,基于初始头部相关传递函数数据库中的第一冲激响应,生成声源角度对应的方向滤波器,进而仅在头部相关传递函数数据库中存储方向滤波器的参数,能够减少方向滤波器的参数,并且,由于方向滤波器共用极点参数,进一步减少了方向滤波器的参数,从而实现减小hrtf数据库大小节省hrtf数据库存储空间的目的。
[0086]
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0087]
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0088]
图1是根据一示例性实施例示出的一种方向滤波器的生成方法的流程图。
[0089]
图2是根据一示例性实施例示出的一种根据第一冲激响应,确定与每一声源角度对应的目标系统频率响应的方法的流程图。
[0090]
图3是根据一示例性实施例示出的一种方向滤波器的结构示意图。
[0091]
图4是根据一示例性实施例示出的一种生成声源角度对应的方向滤波器方法的流程图。
[0092]
图5是根据一示例性实施例示出的一种音频处理方法的流程图。
[0093]
图6是根据一示例性实施例示出的水平角、俯仰角示意图。
[0094]
图7是根据一示例性实施例示出的一种方向滤波器的生成装置框图。
[0095]
图8是根据一示例性实施例示出的一种音频处理装置的框图。
[0096]
图9是根据一示例性实施例示出的一种方向滤波器的生成装置的框图。
[0097]
图10是根据一示例性实施例示出的一种音频处理装置的框图。
具体实施方式
[0098]
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0099]
需要说明的是,本技术中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
[0100]
在相关技术中,可以通过以下两种方式生成hrtf数据库。在第一种方式中,将带有角度特征的冲激响应与输入的信号在时域进行卷积,但是往往hrtf数据库中直接提取出来的冲激响应十分冗长,因此在做卷积时需要耗费极大的算力,且未经处理的hrtf数据库会占用较大的存储空间。在第二种方式中,将冲激响应与输入信号做快速傅里叶变换fft,虽然对比第一种方法,实时处理更有优势,但是hrtf数据库大小没有变化,仍然要占用较大的存储资源。如此,在相关技术中均不能减少hrtf数据库大小,导致在对音频信号进行处理过程中的计算量就较大。
[0101]
有鉴于此,本公开提供一种方向滤波器的生成方法、音频处理方法、装置及存储介质,通过减少方向滤波器的参数,实现减小hrtf数据库的大小节省hrtf数据库存储空间的目的。
[0102]
图1是根据一示例性实施例示出的一种方向滤波器的生成方法的流程图。如图1所示,该方法包括以下步骤。
[0103]
在步骤s11中,根据初始头部相关传递函数数据库,确定与每一声源角度对应的第一冲激响应。其中,初始头部相关传递函数数据库中存储有多个初始头部相关传递函数,每个初始头部相关传递函数用于表示一个声源角度和与声源角度对应的第一冲激响应的函
数关系。
[0104]
在本公开中,hrtf数据库中存储有每一声源角度对应的第一冲激响应,用于描述自由声场中声波从发声源到人体双耳的过程,反映人体身体部位对声波的综合滤波效果。
[0105]
示例地,hrtf数据库中的第一冲激响应可以记为其中,表征声源角度对应的第一冲激响应的转置,表征声源角度对应的第一冲激响应的转置,m表征hrtf数据库中第一冲激响应的个数,n表征每个第一冲激响应的长度。其中,θ表征声源角度中的俯仰角,表征声源角度中的水平角,m、n均为大于1的整数。
[0106]
在步骤s12中,根据第一冲激响应,确定与每一声源角度对应的目标系统频率响应。
[0107]
示例地,对声源角度对应的第一冲激响应进行傅里叶变换可以得到该声源角度对应的系统频率响应h(e
jw
),进而可以根据从所确定的系统频率响应h(e
jw
)中确定出每一声源角度对应的目标系统频率响应。
[0108]
在步骤s13中,构建初始的每一声源角度对应的方向滤波器,且方向滤波器共用预设的极点参数。
[0109]
其中,方向滤波器中包括零点参数和极点参数,其中,方向滤波器的零点参数是指方向滤波器的输入幅度不为零,且输入频率使方向滤波器输出为零的输入频率值。方向滤波器的极点参数是指方向滤波器的输入幅度不为零,且输入频率使方向滤波器输出为无穷大的输入频率值。方向滤波器共用预设的极点参数表征每一方向滤波器的极点参数均是相同的,也即是,各个方向滤波器在该相同的输入频率值下,每一个方向滤波器的输出均为无穷大。
[0110]
在本公开中,针对每一声源角度均预先构建一个初始的该声源角度对应的方向滤波器。示例地,可以对初始头部相关传递函数数据库中包括的每一声源角度均构建一方向滤波器。
[0111]
在步骤s14中,针对每一声源角度,根据单位冲激函数、声源角度对应的目标系统频率响应和初始的声源角度对应的方向滤波器,生成声源角度对应的方向滤波器。其中,单位冲激函数是指输入为单位脉冲函数时方向滤波器的响应函数。
[0112]
示例地,针对每一声源角度,可以将单位冲激函数δ(k)作为模型输入参数,将该声源角度对应的目标系统频率响应作为模型输出参数,对该声源角度对应的方向滤波器进行训练,训练结束后得到该声源角度对应的方向滤波器。
[0113]
采用上述技术方案,基于初始头部相关传递函数数据库中的第一冲激响应,生成声源角度对应的方向滤波器,进而仅在头部相关传递函数数据库中存储方向滤波器的参数,能够减少方向滤波器的参数,并且,由于方向滤波器共用极点参数,进一步减少了方向滤波器的参数,从而实现减小hrtf数据库大小节省hrtf数据库存储空间的目的。
[0114]
为了便于本领域技术人员更好的理解本公开所提供的方向滤波器的生成方法,下面以一个完整的实施例对该方法进行详细说明。
[0115]
首先,对图1中步骤s12的具体实施方式进行说明。如图2所示,步骤s12可以包括如下步骤。
[0116]
在步骤s121中,将第一冲激响应转换为每一声源角度对应的第二系统频率响应。
[0117]
示例地,可以对声源角度对应的第一冲激响应进行傅里叶变换可以得到该声源角度对应的第二系统频率响应h(e
jw
)。
[0118]
在步骤s122中,确定第二系统频率响应对应的失真频段,以及,根据失真频段和预设的均衡器,生成每一声源角度对应的新的冲激响应。
[0119]
考虑到第二系统频率响应中会存在信号失真的频段,为了确保第二系统频率响应在每一频段均是正常的,因此,在本公开中,设置一组均衡器用来修复失真的第二系统频率响应,进而通过该失真频段和均衡器生成每一声源角度对应的新的冲激响应。其中,生成新的冲激响应的数量与初始头部相关传递函数数据库中的第一冲激响应的数量、长度均相同。示例地,假设初始头部相关传递函数数据库中的第一冲激响应的数量为m,长度为n,则生成新的冲激响应的数量也为m,长度也为n。
[0120]
在步骤s123中,将每一声源角度对应的新的冲激响应转换为每一声源角度对应的新的系统频率响应,并将每一声源角度对应的新的系统频率响应确定为每一声源角度对应的目标系统频率响应。
[0121]
其中,利用傅里叶变换将新的冲激响应转换为新的系统频率响应。在得到每一声源角度对应的新的系统频率响应之后,将该新的系统频率响应确定为相应声源角度对应的目标系统频率响应。
[0122]
示例地,将第m个声源角度对应的新的系统频率响应,确定为该声源角度对应的目标系统频率响应,其中,m的取值范围为1至m。
[0123]
采用上述技术方案,利用均衡器修复失真的系统频率响应以得到新的冲激响应,如此,能够确保利用新的冲激响应得到的新的系统频率响应在每一频段的信号均是正常的。
[0124]
在一种实施例中,考虑到采用对数尺度选取极点参数时,会使得低频部分相对密集,高频部分相对稀疏,而人类的听觉系统识别的是低频的音频,因此,可以采用对数尺度设置方向滤波器共用的极点参数,即,多个方向滤波器共用的极点参数采用对数尺度。如此,非线性间隔的极点参数更符合人类的听觉系统。
[0125]
在本公开中,构建的方向滤波器可以包括k个并联结构的二阶基本节零极点滤波器和l+1阶全零点滤波器,且k为大于1的整数,l为大于0的整数。相应地,方向滤波器共用的极点参数包括第一阶极点参数和第二阶极点参数。
[0126]
值的说明的是,k和l的取值越大,方向滤波器对音频信号处理的精度就越大,但是,hrtf数据库中存储的数据就会越大。在本公开中,可以根据实际需求设置合理的k和l。
[0127]
示例地,图3是根据一示例性实施例示出的一种方向滤波器的结构示意图。如图3所示,该声源角度对应的方向滤波器包括k个并联结构的二阶基本节零极点滤波器和l+1阶全零点滤波器。其中,每一个零极点滤波器均包括极点参数模块和增益模块,且第k个二阶基本节零极点滤波器中包括的极点参数模块的表达式为包括的增益模块的第一增益系数为第二增益系数为相应地,第k个基本节零极
点滤波器的通用表达式为k取值范围为1至k。每一全零点滤波器的增益系数为l的取值范围为1至l。
[0128]
参考图3,方向滤波器的z域系统传递函数满足如下公式:
[0129][0130]
其中,表征声源角度对应的方向滤波器的z域系统传递函数,分别表征声源角度对应的方向滤波器中第k个二阶基本节零极点滤波器中的第一增益系数、第二增益系数,a
1,k(z)
、a
2,k(z)
分别表征声源角度对应的方向滤波器中第k个二阶基本节零极点滤波器中第一阶极点参数、第二阶极点参数,表征第l阶全零点滤波器中的增益系数。
[0131]
值的说明的是,在上述公式中,第一阶极点参数、第二阶极点参数是采用对数尺度预先设置的。而以及则是在生成滤波器的过程中计算得到的。
[0132]
采用上述技术方案,采用并联型结构的滤波器具有量化误差敏感度低运算速度更快的特征,从而对音频信号进行实时处理时更高效。
[0133]
示例地,如图4所示,图1中步骤s14可以包括以下步骤
[0134]
在步骤s141中,针对每一声源角度,将单位冲激函数输入初始的声源角度对应的方向滤波器,得到声源角度对应的第二冲激响应。
[0135]
在步骤s142中,根据声源角度对应的第二冲激响应和声源角度对应的目标系统频率响应,确定声源角度对应的方向滤波器的相关参数。
[0136]
在本公开中,方向滤波器的相关参数为方向滤波器中与零点相关的参数。
[0137]
值的说明的是,本公开中除了确保所生成的方向滤波器的参数较少之外,还需确保该方向滤波器的系统频率响应整体逼近原始hrtf数据库中的冲激响应对应的系统频率响应,因此,在本公开中,需要将单位冲激函数输入初始的声源角度对应的方向滤波器,得到声源角度对应的第二冲激响应,之后,将声源角度对应的第二冲激响应转换为声源角度对应的第一系统频率响应,通过以下公式,确定声源角度对应的第一系统频率响应与声源角度对应的目标系统频率响应之间的平方误差:
[0138][0139]
其中,表征声源角度对应的第一系统频率响应与声源角度对应的目标系统频率响应之间的平方误差,n表征所述第一系统频率响应的长度,应的目标系统频率响应之间的平方误差,n表征所述第一系统频率响应的长度,应的目标系统频率响应之间的平方误差,n表征所述第一系统频率响应的长度,对应的第一系统频率响应,表征声源角度对应的目标系统频率响应。
[0140]
最后,根据平方误差确定声源角度对应的方向滤波器的相关参数。例如,利用已知参数构造矩阵,用最小二乘算法估计该声源角度对应的方向滤波器中第k个二阶
基本节零极点滤波器中的第一增益系数第二增益系数以及,第l阶全零点滤波器中的增益系数其中,所确定的声源角度对应的方向滤波器的相关参数向量可以表示为:
[0141][0142]
值的说明的是,针对每一声源角度对应的方向滤波器,均可以按照上述方式,计算出该声源角度对应的方向滤波器的相关参数。
[0143]
在步骤s143中,根据相关参数和预设的极点参数,生成声源角度对应的方向滤波器。
[0144]
示例地,将所确定出的该声源角度对应的方向滤波器的相关参数向量代入上述公式(1)中,即可生成声源角度对应的方向滤波器。
[0145]
在按照上述方式生成每一声源角度对应的方向滤波器之后,在获取到待处理的音频信号时,确定输出该待处理音频信号的音频播放设备,以及,利用该音频播放设备中设置的陀螺仪,确定该音频播放设备的目标声源角度,进而从所生成的每一声源角度对应的方向滤波器中确定出该目标声源角度对应的目标方向滤波器,并利用该目标方向滤波器对待处理的音频信号进行处理。如此,可以减少对处理音频信号的计算量。
[0146]
图5是根据一示例性实施例示出的一种音频处理方法的流程图,该音频处理方法应用于头戴式音频播放设备,所述头戴式音频播放设备包括扬声器和陀螺仪。如图5所示,该方法可以包括以下步骤。
[0147]
在步骤s51中,获取待输入扬声器的第一双通道音频信号。
[0148]
在步骤s52中,在获取第一双通道音频信号的同时或前后预定时间内,获取陀螺仪的采集数据。
[0149]
在步骤s53中,基于采集数据得到佩戴头戴式音频播放设备的用户的头部角度信息,并将头部角度信息确定为第一双通道音频信号的声源角度。
[0150]
在步骤s54中,在预设的滤波器数据库中查找与声源角度对应的方向滤波器。其中,滤波器数据库中包括多个声源角度,每个声源角度有对应的方向滤波器;以及,滤波器数据库中的方向滤波器采用本公开所提供的方向滤波器的生成方法生成。
[0151]
在步骤s55中,根据方向滤波器对第一双通道音频信号进行滤波处理,得到第二双通道音频信号,其中,第二双通道音频信号具有方向感。
[0152]
在步骤s56中,将第二双通道音频信号输入至扬声器,以由扬声器播放。
[0153]
在本公开实施例中,获取第一双通道音频信号,在获取第一双通道音频信号的同时获取头戴式音频播放设备设置的陀螺仪的采集数据。可以理解地,输入的第一双通道音频信号为双通道的音频,即分别对应左耳和右耳的输入音频信号。获取陀螺仪的采集数据,也可以是在获取第一双通道音频信号之前和/或之后预定时间内。基于陀螺仪的采集数据得到佩戴头戴式音频播放设备的用户的头部角度信息,并将头部角度信息确定为第一双通道音频信号的声源角度用户的头部角度信息包括用户佩戴头戴式音频播放设备时的头部的俯仰角度以及头部的平面角度。
[0154]
图6是根据本公开一示例性实施例示出的水平角、俯仰角示意图。如图6所示,在三
维坐标系o-xyz中,空间向量在平面xoy中的投影与x轴的夹角,即水平角θ,空间向量在平面xoz中的投影与x轴的夹角,即俯仰角φ。
[0155]
在本公开实施例中,预设滤波器数据库中包括多个声源角度,每个声源角度有对应的方向感滤波器,在预设的滤波器数据库中查找与声源角度对应的方向感滤波器。可以理解地,音频播放设备为手机、平板等设备时,当用户使用手机播放影音时,基于手机、平板等设备的陀螺仪,确定输出双声道输入音频的当前声源角度,对双声道音频进行滤波处理后,得到双声道输出音频分别传送至与手机连接的左、右耳机两侧。音频播放设备为耳机设备,耳机输入音频为两通道,基于左、右耳机配置陀螺仪的角度状态,对左耳和右耳的双声道音频进行滤波处理后,得到双声道输出音频分别传送至与手机连接的左、右耳机两侧。
[0156]
在本公开实施例中,滤波器数据库中包括多个声源角度,每个声源角度有对应的方向感滤波器,基于声源角度,在预设的滤波器数据库中查找与声源角度对应的方向感滤波器。根据方向感滤波器对获取到的第一双通道音频信号进行滤波处理,得到具有方向感的第二双通道音频信号。将具有方向感的第二双通道音频信号输入至扬声器,以由扬声器播放。
[0157]
根据本公开实施例,通过获取头戴式音频播放设备配置的陀螺仪的采集数据,得到声源角度,在预设的滤波器数据库中查找与声源角度对应的方向感滤波器,并根据方向感滤波器对第一双通道音频信号进行滤波处理,得到具有方向感的第二双通道音频信号,以由扬声器进行播放,能够减少处理具有方向感双通道音频的计算量。
[0158]
在一些实施例中,对获取的第一双通道音频信号根据方向感滤波器进行滤波处理,得到具有方向感的第二双通道音频信号,以将第二双通道音频信号输入至扬声器进行播放。输入的第一双通道音频信号包括两个第一单通道音频信号,即第一左通道音频信号和第一右通道音频信号,分别对应音频播放设备左耳和右耳的输入音频信号。相应地,方向感滤波器包括两个单通道滤波系数,即左通道滤波器系数和右通道滤波器系数,分别用于对第一左通道音频信号和第一右通道音频信号进行滤波处理,得到对应左耳和右耳的、具有方向感的音频信号。
[0159]
根据本公开实施例,通过获取头戴式音频播放设备配置的陀螺仪的采集数据,得到声源角度,在预设的滤波器数据库中查找与声源角度对应的方向感滤波器,并根据方向感滤波器对第一双通道音频信号进行滤波处理,得到具有方向感的第二双通道音频信号,以由扬声器进行播放,能够减少处理具有方向感双通道音频的计算量。
[0160]
基于同一发明构思,本公开还提供一种方向滤波器的生成装置。图7是根据一示例性实施例示出的一种方向滤波器的生成装置框图。如图7所示,该方向滤波器的生成装置700包括:
[0161]
第一确定模块701,被配置为根据初始头部相关传递函数数据库,确定与每一声源角度对应的第一冲激响应;其中,所述初始头部相关传递函数数据库中存储有多个初始头部相关传递函数,每个所述初始头部相关传递函数用于表示一个声源角度和与所述声源角度对应的第一冲激响应的函数关系;
[0162]
第二确定模块702,被配置为根据所述第一冲激响应,确定与每一声源角度对应的目标系统频率响应;
[0163]
构建模块703,被配置为构建初始的每一声源角度对应的方向滤波器,且所述方向
滤波器共用预设的极点参数;
[0164]
生成模块704,被配置为针对每一声源角度,根据单位冲激函数、所述声源角度对应的目标系统频率响应和初始的所述声源角度对应的方向滤波器,生成所述声源角度对应的方向滤波器。
[0165]
可选地,所述生成模块704包括:
[0166]
输入子模块,被配置为针对每一声源角度,将单位冲激函数输入初始的所述声源角度对应的方向滤波器,得到所述声源角度对应的第二冲激响应;
[0167]
第一确定子模块,被配置为根据所述声源角度对应的第二冲激响应和所述声源角度对应的目标系统频率响应,确定所述声源角度对应的方向滤波器的相关参数;
[0168]
第一生成子模块,被配置为根据所述相关参数和所述预设的极点参数,生成所述声源角度对应的方向滤波器。
[0169]
可选地,所述第一确定子模块包括:
[0170]
转换子模块,被配置为将所述声源角度对应的第二冲激响应转换为所述声源角度对应的第一系统频率响应;
[0171]
第二确定子模块,被配置为通过以下公式,确定所述声源角度对应的第一系统频率响应与所述声源角度对应的目标系统频率响应之间的平方误差:
[0172][0173]
其中,表征声源角度对应的第一系统频率响应与声源角度对应的目标系统频率响应之间的平方误差,n表征所述第一系统频率响应的长度,表征声源角度对应的第一系统频率响应,表征声源角度对应的目标系统频率响应,θ表征声源角度中的俯仰角,表征声源角度中的水平角;
[0174]
第三确定子模块,被配置为根据所述平方误差,确定所述声源角度对应的方向滤波器的相关参数。
[0175]
可选地,所述方向滤波器包括k个并联结构的二阶基本节零极点滤波器和l+1阶全零点滤波器,且k为大于1的整数,l为大于0的整数。
[0176]
可选地,所述方向滤波器共用的极点参数包括第一阶极点参数和第二阶极点参数;所述方向滤波器的z域系统传递函数满足如下公式:
[0177][0178]
其中,表征声源角度对应的方向滤波器的z域系统传递函数,分别表征声源角度对应的方向滤波器中第k个二阶基本节零极点滤波器中的第一增益系数、第二增益系数,a
1,k(z)
、a
2,k(z)
分别表征声源角度对应的方向滤波器中第k个二阶基本节零极点滤波器中第一阶极点参数、第二阶极点参数,表征第l阶全零点滤波器中的增益系数。
[0179]
可选地,采用对数尺度设置所述方向滤波器共用的极点参数。
[0180]
可选地,所述第二确定模块702包括:
[0181]
转换子模块,被配置为在将所述第一冲激响应转换为每一声源角度对应的第二系统频率响应;
[0182]
第二生成子模块,被配置为确定所述第二系统频率响应的失真频段,以及,根据所述失真频段和预设的均衡器,生成每一声源角度对应的新的冲激响应;
[0183]
第四确定子模块,被配置为将所述每一声源角度对应的新的冲激响应转换为每一声源角度对应的新的系统频率响应,并将所述每一声源角度对应的新的系统频率响应确定为每一声源角度对应的目标系统频率响应。
[0184]
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0185]
本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的方向滤波器的生成方法的步骤。
[0186]
基于同一发明构思,本公开还提供一种音频处理装置。图8是根据一示例性实施例示出的一种音频处理装置的框图,应用于头戴式音频播放设备,所述头戴式音频播放设备包括扬声器和陀螺仪。如图8所示,音频处理装置200包括:
[0187]
第一获取模块201,被配置为获取待输入所述扬声器的第一双通道音频信号;
[0188]
第二获取模块202,被配置为在获取所述第一双通道音频信号的同时或前后预定时间内,获取所述陀螺仪的采集数据;
[0189]
第三获取模块203,被配置为基于采集数据得到佩戴所述头戴式音频播放设备的用户的头部角度信息,并将所述头部角度信息确定为所述第一双通道音频信号的声源角度;
[0190]
查找模块204,被配置为在预设的滤波器数据库中查找与所述声源角度对应的方向滤波器,其中,所述滤波器数据库中包括多个声源角度,每个声源角度有对应的方向滤波器;以及,所述的滤波器数据库中的方向滤波器采用本公开第一方面中任一项所述的方法生成;
[0191]
处理模块205,被配置为根据所述方向滤波器对所述第一双通道音频信号进行滤波处理,得到第二双通道音频信号,其中,所述第二双通道音频信号具有方向感;
[0192]
输入模块206,被配置为将所述第二双通道音频信号输入至所述扬声器,以由所述扬声器播放。
[0193]
图9是根据一示例性实施例示出的一种方向滤波器的生成装置的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
[0194]
参照图9,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(i/o)的接口812,传感器组件814,以及通信组件816。
[0195]
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成方向滤波器的生成方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模
块,以方便多媒体组件808和处理组件802之间的交互。
[0196]
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
[0197]
电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
[0198]
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0199]
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(mic),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
[0200]
i/o接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
[0201]
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
[0202]
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
[0203]
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(asic)、数字信
号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行方向滤波器的生成方法。
[0204]
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成方向滤波器的生成方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0205]
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的方向滤波器的生成方法的代码部分。
[0206]
图10是根据一示例性实施例示出的一种音频处理装置的框图。例如,装置300可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
[0207]
参照图10,装置300可以包括以下一个或多个组件:处理组件303,存储器304,电力组件306,多媒体组件308,音频组件310,输入/输出(i/o)的接口312,传感器组件314,以及通信组件316。
[0208]
处理组件303通常控制装置300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件303可以包括一个或多个处理器320来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件303可以包括一个或多个模块,便于处理组件303和其他组件之间的交互。例如,处理组件303可以包括多媒体模块,以方便多媒体组件308和处理组件303之间的交互。
[0209]
存储器304被配置为存储各种类型的数据以支持在装置300的操作。这些数据的示例包括用于在装置300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
[0210]
电力组件306为装置300的各种组件提供电力。电力组件306可以包括电源管理系统,一个或多个电源,及其他与为装置300生成、管理和分配电力相关联的组件。
[0211]
多媒体组件308包括在所述装置300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件308包括一个前置摄像头和/或后置摄像头。当装置300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0212]
音频组件310被配置为输出和/或输入音频信号。例如,音频组件310包括一个麦克风(mic),当装置300处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配
置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器304或经由通信组件316发送。在一些实施例中,音频组件310还包括一个扬声器,用于输出音频信号。
[0213]
i/o接口312为处理组件303和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
[0214]
传感器组件314包括一个或多个传感器,用于为装置300提供各个方面的状态评估。例如,传感器组件314可以检测到装置300的打开/关闭状态,组件的相对定位,例如所述组件为装置300的显示器和小键盘,传感器组件314还可以检测装置300或装置300一个组件的位置改变,用户与装置300接触的存在或不存在,装置300方位或加速/减速和装置300的温度变化。传感器组件314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件314还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件314还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
[0215]
通信组件316被配置为便于装置300和其他设备之间有线或无线方式的通信。装置300可以接入基于通信标准的无线网络,如wifi,3g或3g,或它们的组合。在一个示例性实施例中,通信组件316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件316还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
[0216]
在示例性实施例中,装置300可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
[0217]
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器304,上述指令可由装置300的处理器320执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、软盘和光数据存储设备等。
[0218]
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
[0219]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1