麦克风阵列、记录装置和方法以及程序与流程

文档序号:21850374发布日期:2020-08-14 17:30阅读:477来源:国知局
麦克风阵列、记录装置和方法以及程序与流程

本技术涉及麦克风阵列、记录装置、记录方法和程序,尤其涉及一种能够以低成本执行宽带声场记录的麦克风阵列、记录装置、记录方法和程序。



背景技术:

近年来,声音波面的记录和再现在音频产业中已经变得普遍。与过去的多声道再现技术相比,合成和重建波面的技术使得可以定位出设置在空间中的物体的声像并执行空间噪声消除,因此可以提供更真实的声学体验。

例如,包括全向麦克风的开放式圆形麦克风阵列用于各种应用。

然而,圆形麦克风阵列的麦克风设置的这种设计不适于在宽频率范围内记录波面(声场)。原因在于,当使用圆形麦克风阵列时,在特定频率范围内,称为贝塞尔函数的用于获得记录的声音波面的球面谐波系数的模式函数为零。

因此,例如,为了减小模式函数为零的区域,多个麦克风以两个或两个以上的多圆形形式设置,使用心形定向麦克风(例如,参考非专利文献1),或者使用刚性挡板。

此外,存在一些使用全向麦克风的阵列记录技术(例如,参考非专利文献2和3以及专利文献1至3)。

引用列表

非专利文献

非专利文献1:g.huang“designofrobustconcentriccirculardifferentialmicrophonearrays”,thejournaloftheacousticalsocietyofamerica,2017。

非专利文献2:z.prime和c.doolan“acomparisonofpopularbeamformingarrays”,proceedingsofacoustics2013victorharbor:sciencetechnologyandamenity,annualconferenceoftheaustralianacousticalsociety,2013。

非专利文献3:d.mandal、s.p.ghoshal和a.k.bhattacharjee“concentriccircularantennaarraysynthesisusingparticleswarmoptimizationwithconstrictionfactorapproach”,indianantennaweek:aworkshoponadvancedantennatechnology,2010。

专利文献

专利文献1:美国专利号6205224

专利文献2:日本未审查专利申请公开号2005-521283

专利文献3:日本专利申请公开号2011-15050



技术实现要素:

技术问题

然而,使用上述技术难以以低成本进行宽带声场记录。

例如,在许多情况下,通过应用诸如以多圆形形式设置多个麦克风、使用心形定向麦克风或使用刚性挡板的方法,来在足够宽的频率范围上执行声场记录是不可行的,或者由于成本或物理限制,难以在足够宽的频率范围上执行声场记录。

此外,在非专利文献2和专利文献1至3中公开的技术是用于减少波束形成的旁瓣的技术,并且在非专利文献3中公开的技术并非旨在用于声音。因此,这些阵列记录技术不适合于再现波面的记录。

鉴于上述情况而提出本技术,其目的是以低成本进行宽带声场记录。

问题的解决方案

本技术的第一方面的麦克风阵列是用于声场记录的麦克风阵列,其包括多个子阵列,每个子阵列包括多个麦克风,并且每个子阵列具有包括指定半径的离散旋转对称形状,其中,当多个子阵列的半径值形成数列时,该数列是广义算术数列。

在本技术的第一方面,麦克风阵列是用于声场记录的麦克风阵列,其包括多个子阵列;子阵列包括多个麦克风,并且具有包括指定半径的离散旋转对称形状;当多个子阵列的半径值形成数列时,该数列是广义算术数列。

本技术的第二方面的记录装置包括球面谐波系数计算器,该球面谐波系数计算器基于由用于声场记录的麦克风阵列执行的声音收集所获得的多声道信号,来计算球面谐波系数,该麦克风阵列包括多个子阵列,每个子阵列包括多个麦克风,并且每个子阵列具有包括指定半径的离散旋转对称形状,其中,当多个子阵列的半径值形成数列时,该数列是广义算术数列。

本技术的第二方面的记录方法或程序是对应于本技术的第二方面的记录装置的记录方法或程序。

在本技术的第二方面,基于由用于声场记录的麦克风阵列执行的声音收集所获得的多声道信号来计算球面谐波系数,该麦克风阵列包括多个子阵列。此外,多个子阵列的每一个包括多个麦克风,并且每个子阵列都具有包括指定半径的离散旋转对称形状,其中,当多个子阵列的半径值形成数列时,该数列是广义算术数列。

发明的有益效果

本技术的第一方面和第二方面能够以低成本执行宽带声场记录。

注意,本文描述的效果不一定是限制性的,并且可以提供本公开中描述的任何效果。

附图说明

图1是描述取决于麦克风的设置的模式函数值的示图;

图2是描述取决于麦克风的设置的模式函数值的示图;

图3示出根据本技术的麦克风阵列的配置的示例;

图4是描述麦克风的设置的示图;

图5示出根据本技术的麦克风阵列的配置的示例;

图6示出根据本技术的麦克风阵列的配置的示例;

图7示出根据本技术的麦克风阵列的配置的示例;

图8示出根据本技术的麦克风阵列的配置的示例;

图9是描述取决于麦克风的设置的模式函数值的示图;

图10是描述取决于麦克风的设置的条件数的示图;

图11是描述取决于麦克风的设置的条件数的示图;

图12是描述取决于麦克风的设置的条件数的示图;

图13示出根据本技术的记录系统和再现系统的配置的示例;

图14是描述记录处理的流程图;

图15是描述再现处理的流程图;

图16示出计算机的配置的示例。

具体实施方式

<第一实施方式>

<关于本技术>

本技术能够通过使用麦克风阵列的几何设置,来在宽频率范围内记录和再现平面声场。

本技术使得可以参数化地确定每个麦克风的设置,即麦克风阵列中每个麦克风单元的设置。注意,如果根据各种使用情形适当地确定定义麦克风单元设置的设置参数,这就足够了。例如,麦克风阵列包括多个子阵列,每个子阵列包括多个麦克风,每个子阵列具有离散旋转对称形状,并且这些子阵列具有彼此相似的形状。

上述本技术使得可以提高对麦克风放置的误差和由于例如麦克风的制造变化引起的误差的鲁棒性,并且可以记录和再现声场,即在更宽的频率范围上的声音波面。此外,还可以容易地满足麦克风成本和麦克风单元性能(例如,信噪比(snr))的要求。

下面参考附图描述根据本技术的实施方式。

根据本技术的用于声场记录的麦克风阵列通常是基本圆形的麦克风阵列,其中,各个麦克风设置在二维平面中,以围绕麦克风阵列的中心。然而,配置不限于此,并且麦克风阵列可以是用于记录三维声场的麦克风阵列,其中,各个麦克风被设置在三维空间中。

换言之,当麦克风设置在三维空间中时,根据本技术的麦克风阵列可以是例如基本球形的麦克风阵列,其中,各个麦克风设置在三维空间中,以围绕麦克风阵列的中心。

假设根据本技术的麦克风阵列具有通过将各个麦克风设置在二维平面中获得的结构,下面继续描述。

如果当由麦克风阵列记录的声音波面的信号(声场)转换成球面谐波域的信号时,贝塞尔函数为零,则存在不能准确执行转换的频率范围。

例如,如果麦克风阵列是单圆形或双圆形形式的,则将存在模式函数值(即贝塞尔函数值)为零的频率范围,如图1所示。

注意,在图1中,横轴表示波数,纵轴表示球面谐波域的阶数。此外,图1中的亮和暗表示贝塞尔函数的值,具体地,黑色部分的区域表示贝塞尔函数值为0(零)的区域。

更具体地,图1所示的贝塞尔函数值是麦克风阵列中包括的每个麦克风的贝塞尔函数值中的最大值。每个麦克风的贝塞尔函数值根据从麦克风阵列的中心到麦克风的距离而变化。

在图1中,由箭头q11指示的部分表示当麦克风阵列为单圆形形式时对应于波数和阶数的每个区域中的贝塞尔函数值。在这个示例中,例如,贝塞尔函数值在诸如由箭头q11指示的区域的许多区域是零,这表明存在不能准确记录或再现波面的频率范围。

另一方面,由箭头q12指示的部分表示当麦克风阵列为双圆形形式时对应于波数和阶数的每个区域中贝塞尔函数值。这个示例表明贝塞尔函数值为零的区域小于由箭头q11指示的示例中的区域。然而,关于贝塞尔函数值,存在大量接近于零的小的值,这可能严重影响波面的记录和再现。

同样,例如,如图2所示,使用心形定向麦克风作为麦克风阵列中包括的麦克风,使得可以减小贝塞尔函数值为零的区域,但是这导致高成本。

注意,在图2中,横轴表示波数,纵轴表示球面谐波域的阶数。此外,图2中的亮和暗表示模式函数值,即贝塞尔函数值,具体地,黑色部分的区域表示贝塞尔函数值为0(零)的区域。更具体地,图2所示的贝塞尔函数值是麦克风阵列中包括的每个麦克风的贝塞尔函数值中的最大值。

在图2所示的示例中,与图1所示的示例相比,对于每个波数中等于或小于某个阶数的区域,存在贝塞尔函数值为零的少数区域,但是使用心形定向麦克风会导致高成本。

此外,尽管过去已经提出了一些使用全向麦克风的阵列记录技术,但是这些技术不适合于执行声音波面再现的记录。

另一方面,也有一种简单的方法来避免贝塞尔函数值为零的状态。例如,当使用双圆形形式的麦克风阵列时,并且当一个圆形麦克风阵列中的贝塞尔函数值为零、并且另一圆形麦克风阵列中的贝塞尔函数值不为零时,可以使用不为零的贝塞尔函数值。然而,在这种方法中,不能以足够的准确度获得球面谐波域的信号。

通常,避免麦克风特有的传感器噪声或环境噪声是不可行的。此外,由于麦克风的放置误差或麦克风的制造变化,难以使麦克风的实际设置位置和由理论设计的坐标表示的设置位置精确一致。

由于在再现记录的波面时通过贝塞尔函数的小的值执行除法,这些噪声变得更大,并且放置误差和例如由于制造变化引起的误差变得更大,这导致严重影响数值计算。因此,重要的是,不仅要执行一种避免贝塞尔函数值为零的状态的方法,而且还要在设计麦克风设置时优化或分析误差容限。

换言之,为了更准确地记录和再现波面,需要对误差有高容限,即对误差的鲁棒性。具体地,考虑到成本、物理限制和执行信号处理的容易性,需要设计一种实现对误差的高容限、并且旨在使用最少数量的全向麦克风的麦克风设置。

在此处,描述了声音波面的记录和再现,即声场的记录和再现。注意,包括在麦克风阵列中的麦克风在下文中也具体称为麦克风单元。

例如,可以通过获得波面的球面谐波系数来记录和再现声音的波面。

具体地,当圆形麦克风阵列用于记录波面时,在满足采样定理的条件下,通过在q个相应点采样波面的声压来获得球面谐波系数amn(k)。

此外,通过将声压除以bn(kr),来去除包括在声压中并且取决于圆形麦克风阵列的半径r的分量,bn(kr)是取决于半径r的分量。

换言之,可以使用下面的公式(1)获得球面谐波系数amn(k)。

[公式1]

注意,在公式(1)中,n和m均表示球面谐波域的阶数,q是表示对声压执行采样的q个点中的每一个的索引,其中,q=0,...,q-1。由索引q表示的采样点在下文中也称为点q。

此外,k表示波数,r表示圆形麦克风阵列的半径,即,从圆形麦克风阵列的中心位置到麦克风单元的距离。θq和分别表示仰角和方位角,仰角和方位角中的每一个表示位于点q的麦克风单元取向的方向。

此外,在公式(1)中,f表示频率,cs表示波速,bn(kr)表示模式函数,表示球面谐波基。具体地,当圆形麦克风阵列包括全向麦克风时,作为模式函数的bn(kr)是球形贝塞尔函数。bn(kr)在下文中也简称为贝塞尔函数。此外,球面谐波基中的“*”表示复共轭。

注意,在例如“b.rafaely,fundamentalsofsphericalarrayprocessing,springer,2015”中详细公开圆形麦克风阵列包括全向麦克风的示例(以下也称为参考文献1)。

此外,公式(1)中的运算处理,特别是通过公式(1)中的贝塞尔函数bn(kr)执行除法的除法处理也称为模式补偿。注意,在例如“d.p.jarrett,e.a.habets和p.a.naylor,theoryandapplicationsofsphericalmicrophonearrayprocessing,springer,2017”中详细公开模式补偿(以下也称为参考文献2)。

当使用圆形麦克风阵列在每个点q收集声音时,并且当通过获得点q处的声压来记录声音的波面时,可以通过使用公式(1)使用获得的声压来获得球面谐波系数amn(k)。此外,当如上所述获得的球面谐波系数amn(k)传输到再现系统时,再现系统可以使用球面谐波系数amn(k)再现声音的波面(声场)。

顺便说一下,当公式1中的贝塞尔函数bn(kr)值接近零时,就会出现称为贝塞尔零问题的数值问题。换言之,如下所述,当贝塞尔函数bn(kr)值接近零时,用于获得球面谐波系数amn(k)的变换矩阵的条件数(conditionnumber)变大,这导致不能获得准确的球面谐波系数amn(k)。

当包括在圆形麦克风阵列中的各个麦克风单元不位于相同的环形形状上时,即,当设置在各个点q处的各个麦克风单元具有不同的半径rq时,在点q处采样的声压由下面的公式(2)表示。注意,麦克风单元的半径rq对应于从圆形麦克风阵列的中心到麦克风单元的距离,即,从圆形麦克风阵列的中心到点q的距离。

[公式2]

在这种情况下,通过将在各个点q处获得的声压的分布(即由声压组成的向量pk)乘以b+k,获得每个阶数和波数的球面谐波系数amn(k),其中,b+k是变换矩阵bk的伪逆矩阵。

换言之,例如,可以通过执行下面的公式(3)的计算来获得由波数k的球面谐波系数amn(k)组成的向量a(k)。

[公式3]

在公式(3)中,b+k表示变换矩阵bk的伪逆矩阵。注意,向量pk是由各个点l处的声压组成的向量,如下面的公式(4)所示,其中,l=0、...、l和l=q-1。换言之,在公式(4)中,l表示指示声压采样点的索引,并且l对应于上述q。

此外,如下面的公式(5)所示,变换矩阵bk是这样的矩阵,其元素是相对于每个点l的阶数n,贝塞尔函数bn(krl)和球面谐波的乘积,其中,0≤n≤n。

[公式4]

[公式5]

在上述公式(3)中,公式(1)中所示的在作为模式补偿的除法中被伪逆矩阵b+k代替。为了使用该公式(3)获得准确的球面谐波系数amn(k),变换矩阵bk需要是可逆的并且避免病态。在此处,可以通过例如关于变换矩阵bk的条件数来评估变换矩阵bk是良态还是病态。

当变换矩阵bk的最小奇异值和最大奇异值分别为σmin(bk)和σmax(bk)时,可以使用下面的公式(6)获得变换矩阵bk的条件数x(k)。

[公式6]

在公式(3)的计算中,当误差包括在观察的向量中时,即误差包括在这种情况下的向量pk中时,误差增加了x(k)倍,其中,x(k)表示条件数。

因此,变换矩阵bk的条件数x(k)有利地更小,并且小的条件数x(k)指示对误差的高容限,即,对误差的改进的鲁棒性。根据经验,尽管它取决于应用,但条件数大于100的矩阵是病态的。注意,例如,在上述参考文献1中详细公开了基于条件数执行的圆形麦克风阵列或球形麦克风阵列的误差的容限分析。

如上所述,可以通过执行公式(3)的计算来获得用于再现声音波面的球面谐波系数amn(k),并且可以通过适当地设置麦克风阵列中包括的每个麦克风单元的设置、和球面谐波域的n阶的最大值(最高阶)来获得良态的变换矩阵bk。

因此,通过适当地设置麦克风单元的设置和球面谐波域的最大阶,本技术使得可以使用更少的全向麦克风单元(即以低成本),在宽频率范围上实现对噪声的高容限(对误差的高容限)。

具体地,通过参数化地设计具有下述特征的麦克风阵列并根据频率执行空间分辨率控制,来执行根据本技术的波面记录和再现。

例如,根据本技术的麦克风阵列具有以下特征f1至f3。换言之,基于以下特征f1至f3设计根据本技术的麦克风阵列。

(特征f1)

麦克风阵列包括多个几何相似的子阵列,并且每个子阵列是离散旋转对称的。

(特征f2)

从麦克风阵列的中心看,麦克风单元以相等角度分布。

(特征f3)

当各个子阵列的半径值形成数列(progression)时,该数列是广义算术数列。

根据本技术的麦克风阵列包括多个子阵列,并且每个子阵列包括多个麦克风单元。

注意,麦克风阵列可以包括单个子阵列,或者子阵列可以包括单个麦克风单元。

此外,麦克风阵列中包括的所有麦克风单元基本上都是全向麦克风,但是一些麦克风单元可能不是全向麦克风。

上述特征f1是这样的特征,即当麦克风阵列包括多个子阵列时,所有子阵列具有几何相似的形状(处于相似的麦克风单元设置中)。在此处,几何上彼此相似的子阵列是指子阵列中包括的多个麦克风单元具有相似的设置。

例如,在几何上彼此相似的两个子阵列是指当对一个子阵列执行放大操作、缩小操作、旋转操作或反转操作中的至少一项时,一个子阵列与另一子阵列一致。

在此处,一致是指在例如对一个子阵列执行放大操作之后,一个子阵列中包括的每个麦克风单元的设置位置与另一子阵列中包括的每个麦克风单元的设置位置一致。在这种情况下,每个子阵列的中心位置与麦克风阵列的中心位置一致。

此外,每个子阵列具有离散旋转对称的形状。换言之,子阵列不具有当子阵列旋转任意角度时子阵列恒定地具有相同形状的连续的旋转对称,但是子阵列具有离散的旋转对称,其中,当子阵列围绕子阵列的中心位置(即麦克风阵列的中心位置)旋转特定角度时,旋转前后的子阵列的形状一致。在麦克风阵列中,可以实现平坦的频率特性,因为每个子阵列是离散旋转对称的。

此外,每个子阵列具有特定的半径。具体地,在这种情况下,子阵列中包括的所有麦克风单元具有相等的半径,并且该半径对应于子阵列的半径。麦克风单元的半径对应于从子阵列的中心位置(即从麦克风阵列的中心位置)到麦克风单元的距离。

因此,包括在子阵列中的多个麦克风单元中的每一个被设置成远离麦克风阵列的中心位置(即子阵列的中心位置)一段距离,该距离对应于子阵列的半径。

特征f2是这样的特征,即当包括在麦克风阵列中的所有麦克风单元径向投影到以麦克风阵列的中心位置为中心的单个环形上时,即,投影到麦克风阵列的圆周上时,投影的麦克风单元均匀地分布在环形上。换言之,投影的麦克风单元在环形上等距间隔。

在此处,麦克风单元投影在环形上的位置是连接(穿过)麦克风单元和麦克风阵列的中心位置的线与麦克风单元投影在其上的环形(圆形)相交的位置。换言之,从麦克风阵列的中心位置看,环形上的麦克风单元的位置是麦克风单元投影在其上的位置。

在通过上面给出的特征f2记录波面之后,不再需要执行复杂的信号处理。例如,在上述参考文献1中详细公开了由于这种特性而省略复杂的信号处理。

此外,特征f3是这样的特征,即当麦克风阵列中包括的多个子阵列中存在具有不同半径的子阵列时,并且当麦克风阵列中包括的所有子阵列的半径值形成数列时,该数列是广义算术数列,半径值以升序或降序设置。

换言之,特征f3是这样的特征,即麦克风单元在从麦克风阵列的中心向外的方向上(即在远离中心的方向上),以与广义算术数列的公差相对应的间隔设置。

在例如“z.prime和c.doolan,“acomparisonofpopularbeamformingarrays”,proceedingsofacoustics2013victorharbor:sciencetechnologyandamenity,annualconferenceoftheaustralianacousticalsociety,2013”和美国专利号6205224中,详细公开一种基于与根据对数或几何数列确定的半径相对应的距离来设置麦克风单元的方法。

然而,当针对每个频率控制空间分辨率时,与应用上述方法相比,通过应用本技术来使用广义算术数列确定子阵列的半径,提供了减小贝塞尔函数值为零或接近零的区域的更有效的效果。换言之,变换矩阵bk的条件数x(k)变小。

此外,被设计成具有特征f1和f2的麦克风阵列,使得可以通过使用多个子阵列根据要求实现可扩展使用(scalableuse)。

假设多个几何相似的子阵列被用作包含在麦克风阵列中的子阵列。在这种情况下,例如,可扩展使用是可行的,其中,当有足够多数量的可用麦克风单元时,麦克风阵列包括三个子阵列,而当有少量可用麦克风单元时,麦克风阵列包括两个子阵列。

此外,麦克风阵列的变换矩阵bk取决于频率,即波数k,并且对于操作频率范围中的每个频率适当地设置用于转换的空间分辨率,以便获得准确的声场信息。

例如,当通过执行公式(3)的计算来获得球面谐波系数amn(k)时,如果执行到更高阶n项的计算,则通常以更高的空间分辨率来获得更准确的球面谐波系数amn(k)。然而,对于阶n不小于根据例如麦克风单元设置而确定的特定阶的分量,贝塞尔函数值为零或接近零。

因此,根据本技术,执行从变换矩阵bk中去除(移除)对应于不小于特定阶的每个阶n的行的处理,作为空间分辨率控制,以便改善变换矩阵bk的条件数。换言之,对用于执行运算的阶n进行限制,即变换矩阵bk的行数受到限制。

具体地,本技术的优点在于,可以使用最少数量的全向麦克风单元记录宽带声场(波面)同时实现误差的高容限。

空间分辨率控制不仅可以提高误差容限,还可以减少计算量。

此外,在麦克风阵列中包括多个子阵列,使得可以在不使用少麦克风单元的情况下增加角度方向上的采样密度。原因在于,例如,与麦克风单元以单个圆形形式设置时相比,当麦克风单元径向投影到环形上时,多个子阵列的设置使得可以进一步增加以麦克风阵列的中心位置为中心的环形上投影的麦克风单元的密度。

此外,根据本技术的麦克风阵列具有自相似形状,即分形形状(fractalshape)。因此,本技术实现了可扩展性,使得即使仅使用较少数量的麦克风单元,也可以形成麦克风阵列。换言之,如上所述,可扩展使用是可行的。

<麦克风阵列的配置示例>

接下来,描述根据本技术的麦克风阵列的配置的更具体的示例。图3示出了根据本技术的麦克风阵列的实施方式的配置的示例。

图3中所示的麦克风阵列ma11是包括多个全向麦克风单元的涡流形状的麦克风阵列。注意,在图3中,每个点代表一个麦克风单元。

在该示例中,麦克风阵列ma11包括128个麦克风单元,并且这些麦克风单元以涡流的形式设置。

在麦克风阵列ma11中,一个子阵列包括16个麦克风单元。换言之,麦克风阵列ma11包括具有不同半径的8个子阵列,并且这8个子阵列同心设置。

例如,子阵列sa11是包括16个圆形设置的麦克风单元的部分,同样,子阵列sa12是包括16个圆形设置的麦克风单元的部分。

此外,麦克风阵列ma11具有上述特征f1至f3。

例如,麦克风阵列ma11中包括的各个子阵列具有仅在缩放和旋转角度上不同的形状。具体地,例如,当子阵列sa11放大并旋转特定角度时,放大并旋转的子阵列sa11与子阵列sa12一致。

此外,每个子阵列的麦克风单元以中心位置o11为中心的圆形形式设置,这使得子阵列具有离散旋转对称形状。

图4中给出了麦克风阵列ma11的一部分的放大图。注意,在图4中,每个圆圈代表一个麦克风单元。此外,在图4中,在分别表示在相同子阵列中包括的麦克风单元的圆圈中,给出相同的数字。

在图4所示的示例中,例如,在图3所示的子阵列sa11中包括具有数字“1”的麦克风单元,在图3所示的子阵列sa12中包括具有数字“8”的麦克风单元。

具体地,该示例示出了各个子阵列相邻设置,并且包括这些子阵列的半径值的数列是广义算术数列。换言之,对于任何子阵列,相邻子阵列的半径之间的差显示与公差相对应的多个预定值中的一个。

注意,图3中示出的麦克风阵列ma11在下文中也具体称为涡流形麦克风阵列。

此外,上面已经描述了麦克风阵列包括8个子阵列并且每个子阵列包括16个麦克风单元的示例。然而,例如,麦克风阵列可以包括4个子阵列,并且每个子阵列可以包括32个麦克风单元,或者麦克风阵列可以包括2个子阵列,并且每个子阵列可以包括64个麦克风单元。

此外,根据本技术的麦克风阵列不限于图3所示的麦克风阵列,并且可以具有任何配置,只要其具有特征f1至f3。

具体地,例如,麦克风阵列可以具有图5所示的配置。

换言之,在图5中由箭头q31指示的部分中示出了由以花朵轮廓的形式设置的多个全向麦克风单元形成的麦克风阵列ma21。注意,在由箭头q31指示的部分中,每个点代表一个麦克风单元。

麦克风阵列ma21包括8个子阵列,每个子阵列包括16个圆形设置的麦克风单元。

在箭头q32所示的部分给出麦克风阵列ma21的一部分的放大图。注意,在由箭头q32指示的部分中,每个圆圈代表一个麦克风单元,并且在分别表示在相同子阵列中包括的麦克风单元的圆圈中给出相同的数字。

该示例示出了麦克风阵列ma21中包括的8个子阵列同心设置,并且各个子阵列相邻设置。

具体地,该示例示出了包括具有数字“2”的麦克风单元的子阵列和包括具有数字“8”的麦克风单元的子阵列,在以麦克风阵列ma21的中心位置为中心的旋转角度上是不同的(即,在旋转方向上麦克风单元的设置位置上,但是子阵列具有相等的半径)。

同样,包括具有数字“3”的麦克风单元的子阵列和包括具有数字“7”的麦克风单元的子阵列在旋转角度上不同,但是具有相等的半径。此外,包括具有数字“4”的麦克风单元的子阵列和包括具有数字“6”的麦克风单元的子阵列在旋转角度上不同,但是具有相等的半径。

这种麦克风阵列ma21具有上述特征f1至f3。注意,麦克风阵列ma21在下文中也具体称为花状麦克风阵列。

此外,根据本技术的麦克风阵列可以具有例如图6、图7或图8所示的配置。

换言之,例如,在图6中由箭头q41指示的部分中示出了由基本上以涡流形式设置的多个全向麦克风单元形成的麦克风阵列ma31。注意,在由箭头q41指示的部分中,每个点代表一个麦克风单元。

麦克风阵列ma31包括8个子阵列,每个子阵列具有上述特征f1。此外,每个子阵列包括16个圆形设置的麦克风单元。

在箭头q42所示的部分给出麦克风阵列ma31的一部分的放大图。注意,在由箭头q42指示的部分中,每个圆圈代表一个麦克风单元,并且在分别表示在相同子阵列中包括的麦克风单元的圆圈中给出相同的数字。

在该示例中,麦克风阵列ma31中包括的8个子阵列同心设置,并且在设置子阵列时随机确定每个子阵列的旋转角度。

此外,例如,在图7中由箭头q51指示的部分中示出了由基本上以涡流形式设置的多个全向麦克风单元形成的麦克风阵列ma41。注意,在由箭头q51指示的部分中,每个点代表一个麦克风单元。

麦克风阵列ma41包括8个子阵列,每个子阵列包括16个圆形设置的麦克风单元。

在由箭头q52指示的部分中,给出了麦克风阵列ma41的一部分的放大图。注意,在由箭头q52指示的部分中,每个圆圈代表一个麦克风单元,并且在分别表示在相同子阵列中包括的麦克风单元的圆圈中给出相同的数字。

在该示例中,麦克风阵列ma41中包括的8个子阵列同心设置,并且在设置子阵列时随机确定每个子阵列的旋转角度。

在图6和图7所示的麦克风阵列中,随机确定每个子阵列的旋转角度,并且图6和图7所示的麦克风阵列均具有上述特征f1至f3。注意,这种麦克风阵列在下文中也具体称为随机形状麦克风阵列。

此外,例如,在图8中示出了由以三重圆形式设置的多个全向麦克风单元形成的麦克风阵列ma51。注意,在图8中,每个点代表一个麦克风单元。

麦克风阵列ma51包括3个子阵列,每个子阵列包括43个圆形设置的麦克风单元。

具体地,在该示例中,麦克风阵列ma51中包括的3个子阵列同心设置,并且当放大或缩小3个子阵列中的一个,然后旋转时,3个子阵列中这一个与其他子阵列一致。

具有上述特征f1至f3的麦克风阵列使得可以减小贝塞尔函数值为零的区域,并且可以改善变换矩阵bk的条件数x(k)。例如,采用涡流形麦克风阵列、花状麦克风阵列和随机形状麦克风阵列,均使得没有贝塞尔函数值为零的区域,如图9所示。

注意,在图9中,横轴表示波数,纵轴表示球面谐波域的阶数。此外,图9中的亮和暗表示贝塞尔函数的值,具体地,黑色部分的区域表示贝塞尔函数值为0(零)的区域。更具体地,图9所示的贝塞尔函数值是麦克风阵列中包括的每个子阵列的贝塞尔函数值中的最大值。

在图9中,由箭头q61指示的部分,表示当使用涡流形麦克风阵列时对应于波数k和阶数n的每个区域中的贝塞尔函数值。

此外,由箭头q62指示的部分,表示当使用花状麦克风阵列时对应于波数k和阶数n的每个区域中的贝塞尔函数值。此外,由箭头q63指示的部分,表示当使用随机形状麦克风阵列时对应于波数k和阶数n的每个区域中的贝塞尔函数值。

由箭头q61至q63指示的这些示例表明,在从0khz至8khz的频率范围内,不再存在相对于等于或小于某个n阶贝塞尔函数值为零的区域、在图1所示的示例中存在贝塞尔函数值为零的区域。如上所述,当不再存在贝塞尔函数值为零的区域时,这使得可以使变换矩阵bk的条件数x(k)更小,从而以低成本在宽频率范围上提高对误差的容限。

此外,当根据本技术将空间分辨率控制应用于麦克风阵列时,如果投影到环形上的麦克风单元彼此更靠近,则变换矩阵bk的情况更好,例如,如图10所示。

注意,在图10中,横轴表示频率,纵轴表示变换矩阵bk的条件数x(k)。此外,在图10的示例中,条件数x(k)是当执行稍后描述的空间分辨率控制时的条件数。

在该示例中,曲线l11至曲线l14分别表示图3所示的涡流形麦克风阵列ma11、图5所示的花状麦克风阵列ma21、图6所示的随机形状麦克风阵列ma31、和图7所示的随机形状麦克风阵列ma41的条件数x(k)。

在此处,该示例示出了花状麦克风阵列ma21的条件数x(k)在整个频率范围内最小,因为在花状麦克风阵列ma21的情况下,投射到环形上的麦克风单元之间的距离最短。

另一方面,在涡流形麦克风阵列ma11的情况下,对于每8个麦克风单元,麦克风单元之间的距离相对长。换言之,包括在麦克风阵列ma11中并且最靠近中心的子阵列中的麦克风单元、和包括在离中心最远的子阵列中的麦克风单元彼此远离地设置。

因此,投射到环形上的麦克风单元之间的距离比麦克风阵列ma21的情况下的距离长,并且涡流形麦克风阵列ma11的条件数x(k)略大于花状麦克风阵列ma21的条件数x(k)。

此外,在随机形状麦克风阵列ma31和随机形状麦克风阵列ma41的情况下,投射到环形上的麦克风单元之间的距离相对长。因此,麦克风阵列ma31和ma41的条件数x(k)大于涡流形麦克风阵列ma11的条件数x(k)。

<关于麦克风阵列的设置参数>

顺便说一下,如上所述,本技术使得可以参数化地确定每个麦克风单元在麦克风阵列中的设置。

在此处,指示麦克风阵列的每个麦克风单元的设置的参数称为设置参数,并且多个设置参数的集合称为设置参数集。换言之,包括在麦克风阵列中的每个麦克风单元的设置由设置参数集决定。

具体地,设置参数的示例包括子阵列的数量s、每个子阵列的半径rs(其中,s=0,1,...s-1)、以及子阵列的旋转角度(其中,s=0,1,...s-1)。

在此处,子阵列的数量s是包括在麦克风阵列中的子阵列的数量,子阵列的半径rs对应于从麦克风阵列的中心位置到包括在子阵列中的麦克风单元的距离。包含s个子阵列的半径rs的向量在下文中也称为半径向量rsub。

此外,子阵列的旋转角度是从麦克风阵列的中心位置观察时子阵列相对于指定方向的倾斜角。换言之,子阵列的旋转角度是旋转方向的角度,其指示子阵列在以麦克风阵列的中心位置为中心的旋转方向上的位置。

具体地,例如,假设麦克风阵列的中心位置是中心0,并且从中心0看,用作指定参考的方向是参考方向。在这种情况下,例如,旋转角度是连接中心0和麦克风单元的线与参考方向之间的角度,该麦克风单元包括在子阵列中并用作指定参考。

例如,包含在最靠近中心0的子阵列中并用作参考的麦克风单元的方向被设置为参考方向。在这种情况下,子阵列的旋转角度指示最接近中心0的另一子阵列通过旋转该角度使得另一子阵列与该子阵列一致。

注意,包含s个子阵列的旋转角度的向量在下文中也称为旋转角度向量

作为设置参数的子阵列的数量s、半径向量rsub和旋转角度向量在下文中也称为设置参数集

例如,最佳设置参数取决于麦克风单元的总数q、操作频率范围[fmin,fmax]、麦克风单元的直径dm和条件数x(k)的上限xmax。

在此处,麦克风单元的总数q是麦克风阵列中包括的麦克风单元的数量。麦克风阵列中包括的子阵列的数量(即子阵列的数量s)由麦克风单元的总数q决定。

具体地,例如,当麦克风单元的总数q为24时,子阵列的数量s的值可以被设置为1、2、3、4、6、12或24。

此外,操作频率范围[fmin,fmax]是从目标声音的频率的最小值fmin到最大值fmax的频率范围。

当确定设置参数集pqopt时,考虑操作频率范围[fmin,fmax]中的条件数,优化每个设置参数。

麦克风单元的直径dm是麦克风阵列中包括的麦克风单元的直径,并且dm是确定半径向量rsub的广义算术数列的公差的绝对值的下限。

例如,假设两个任意子阵列的半径rs是半径ri和半径rj(其中,i≠j)。在这种情况下,半径ri和半径rj需要满足下面的公式(7)。原因在于,即使考虑子阵列的半径rs和旋转角度也不可能物理地并排设置具有直径dm的两个麦克风单元,除非满足公式(7)的条件。

[公式7]

此外,上限xmax是在操作频率范围[fmin,fmax]中可接受的条件数x(k)的值,并且指示最佳条件的状态(条件数x(k)的最大值)。

根据经验,条件数x(k)大于100的矩阵是病态的,逆矩阵是不稳定的,尽管它取决于应用。然而,由于多重共线性在许多情况下是不期望的,如果上限xmax设置为大约30,这实际上就足够了。

通过基于麦克风单元的总数q、操作频率范围[fmin,fmax]、麦克风单元的直径dm和上述条件数x(k)的上限xmax来确定最佳设置参数集pqopt,可以获得包括适当设置的麦克风单元的麦克风阵列,使得麦克风阵列具有特征f1至f3。

具体地,例如,通过在操作频率范围[fmin,fmax]中最小化变换矩阵bk的平均条件数,并且由麦克风单元的总数q、直径dm和上限xmax施加约束,来获得最佳设置参数集pqopt。

通过对可能的设置参数执行穷举搜索来实现对设置参数集pqopt的搜索。根据经验,可以通过超启发式优化方法(例如,差分进化)获得基本上最优的结果。

注意,在例如“r.storn和k.price“differentialevolution-asimpleandefficientheuristicforglobaloptimizationovercontinuousspaces”,journalofglobaloptimization,1997”中,详细公开超启发式优化方法(例如,差分进化)(以下也称为参考文献3)。

<关于空间分辨率控制>

接下来,描述麦克风阵列中的空间分辨率控制。

例如,在参考文献1和参考文献2中,为每个频率范围选择适当的空间分辨率以获得更大的鲁棒性是有利的。这意味着空间分辨率的适当选择产生良态的变换矩阵。

实际上,当相对于麦克风阵列的波数k和半径r给出任意值kr时,并且当阶数n恒定地等于或大于某个高阶(以下称为n0(kr))时,随着阶数n变得更高,对应的模式函数(贝塞尔函数)值变得更接近于零。

例如,如下面的公式(8)所示,根据麦克风阵列的麦克风单元的总数q确定的阶数n由narr表示。

[公式8]

n0(kr)<narr=[(q-1)/2]···(8)

在这种情况下,球面谐波项(即变换矩阵bk中对应于n阶至大于n0(kr)的narr的元素)不包括用于再现波面的可靠信息。原因在于,对于n阶至大于n0(kr)的narr,贝塞尔函数值为零或接近零。

因此,根据本技术,排除了这种数值上小的球面谐波项,以最小化信息损失,并且改进了变换矩阵bk的条件。

在这种情况下,执行限制变换矩阵bk的行数的处理,作为空间分辨率控制,变换矩阵bk的行数是用于执行运算以计算球面谐波系数amn(k)的行数,该操作包括模式补偿。

换言之,例如,当max(rs)表示各个子阵列的半径rs的最大值时,通过对变换矩阵bk执行空间分辨率控制而获得的变换矩阵bn0k是包含变换矩阵bk的第1行到第n0(k×max(rs))-th行的矩阵。换言之,由于控制空间分辨率,基于阶n0(k×max(rs)),变换矩阵bk的用于执行运算的行数被限制为n0(k×max(rs))行,并且获得变换矩阵bn0k,作为限制行数的变换矩阵。

在此处,变换矩阵bk的第n0(k×max(rs))-th行是对应于阶n0(k×max(rs))的行。阶n0(k×max(rs))是相对于半径为max(rs)的子阵列的阶。换言之,当半径r=max(rs)时,阶n0(k×max(rs))是阶n0(kr)。

可以采用任何方法,作为相对于半径r确定阶n0(kr)的方法,例如,可以满足n0(kr)=th×r,其中,阈值th的值是1或1.1,或者可以通过执行下面的公式(9)的计算来确定阶n0(kr)。例如,在上述参考文献1和2中详细公开了用于满足n0(kr)=th×r的方法。

[公式9]

注意,如果公式(9)中的阈值th是介于0和1之间的实数,这就足够了,并且接近1的值是有利的。具体地,例如,阈值th被设置为0.95。此外,在上述图3、图5至图8和图10中,以及在稍后描述的图12中,全部使用通过公式(9)定义的阶n0(krs)。

通过执行这种空间分辨率控制,可以改善变换矩阵的条件并提高误差容限。例如,对于当不控制空间分辨率时以及当kr=6时具有麦克风单元的相应设置的麦克风阵列,变换矩阵bk的相应条件数x(k)呈现图11所示的值。注意,在图11中,横轴表示频率,纵轴表示条件数x(k)。

在图11中,曲线l21至曲线l23分别表示圆形麦克风阵列、图3所示的涡流形麦克风阵列ma11和图5所示的花状麦克风阵列ma21的条件数。

该示例示出了所有麦克风阵列的变换矩阵bk的条件数x(k)在低频范围内为大。

由于变换矩阵bk的冗余行引起的线性相关性而发生这种现象,并且根据本技术的麦克风阵列使得可以通过执行空间分辨率控制或适当的矩阵正则化来解决这种现象。

另一方面,对于当控制空间分辨率时具有麦克风单元的相应设置的麦克风阵列,变换矩阵bn0k的相应条件数x(k)呈现图12所示的值。注意,在图12中,横轴表示频率,纵轴表示条件数x(k)。

在图12中,曲线l31至曲线l33分别表示圆形麦克风阵列、图3所示的涡流形麦克风阵列ma11和图5所示的花状麦克风阵列ma21的条件数。

该示例示出了与图11的示例相比,所有麦克风阵列的变换矩阵bn0k的条件数x(k)在低频范围内较小。

此外,圆形麦克风阵列的条件数x(k)取决于频率为大。圆形麦克风阵列的条件的这种恶化是由于贝塞尔函数值变为零而导致的其特定特征,并且不能通过执行空间分辨率控制或矩阵正则化来解决。

另一方面,对于涡流形麦克风阵列ma11和花状麦克风阵列ma21,在大多数频率下,相应的条件数x(k)不大于30。该结果表明,通过对具有适当麦克风单元设置的麦克风阵列执行空间分辨率控制,获得了更好的条件数,并且提高了误差容限。

<记录系统和再现系统的配置示例>

接下来,描述使用上述麦克风阵列记录声音波面(声场)的记录系统、和基于记录系统获得的球面谐波系数amn(k)再现声音波面的再现系统的配置示例。

例如,这种记录系统和这种再现系统如图13所示配置。

在图13中,记录系统包括麦克风阵列11和记录装置12,并且再现系统包括再现装置13和扬声器阵列14。

注意,麦克风阵列11可以是记录装置12的一部分,并且扬声器阵列14可以是再现装置13的一部分。

在记录系统中,声音波面由包括多个麦克风单元的麦克风阵列11记录,并且作为记录结果获得的声音信号的多声道信号提供给记录装置12。换言之,麦克风阵列11通过使用各个麦克风单元收集声音来记录声音波面,并且输出信号作为多声道信号,该信号是通过使用各个麦克风单元执行的声音收集而获得的音频信号。

麦克风阵列11用于记录声场,即声音波面,并且包括多个子阵列。此外,每个子阵列包括多个麦克风单元。具体地,麦克风阵列11是具有上述特征f1至f3的麦克风阵列,例如,图3和图5至图8所示的麦克风阵列,并且麦克风阵列11中包括的麦克风单元是全向麦克风。

记录装置12使用由麦克风阵列11提供的多声道信号来计算球面谐波系数amn(k),并将球面谐波系数amn(k)提供给再现装置13。

在该示例中,记录装置12包括输入部21、时频分析仪22、参数保持部23、空间分辨率控制器24和球面谐波系数计算器25。

输入部21对麦克风阵列11提供的多声道信号执行模数(ad)转换,以将模拟多声道信号转换成数字信号,并将数字信号提供给时频分析仪22。

时频分析仪22对由输入部21提供的多声道信号执行短时傅立叶变换(stft),并将作为执行短时傅立叶变换结果而获得的时频谱提供给球面谐波系数计算器25。由时频分析仪22获得的时频谱对应于公式(4)中所示的声压

参数保持部23保持基于例如预先给定的麦克风单元的总数q、操作频率范围[fmin,fmax]、麦克风单元的直径dm和条件数x(k)的上限xmax确定的设置参数集pqopt。

例如,麦克风阵列11是具有由如上所述确定的设置参数集pqopt确定的形状的麦克风阵列,并且与麦克风阵列11相关的设置参数集pqopt由参数保持部23保持。换言之,设置参数集pqopt是指示麦克风阵列11的麦克风单元设置的几何信息。

参数保持部23将保持在参数保持部23中的设置参数集pqopt提供给空间分辨率控制器24和球面谐波系数计算器25。

空间分辨率控制器24基于由参数保持部23提供的设置参数集pqopt来控制空间分辨率。

换言之,基于包括在根据设置参数集pqopt确定的麦克风阵列11中的子阵列的半径max(rs),空间分辨率控制器24对每个频率(即,针对每个波数k)执行例如上述公式(9)的计算,以计算(确定)阶n0(k×max(rs))。然后,空间分辨率控制器24将如上所述获得的阶n0(k×max(rs))提供给球面谐波系数计算器25,并指示球面谐波系数计算器25限制变换矩阵bk的行数。

球面谐波系数计算器25使用由时频分析仪22提供的时频谱、由参数保持部23提供的设置参数集pqopt以及由空间分辨率控制器24提供的阶n0(k×max(rs)),来计算球面谐波系数amn(k)。

例如,球面谐波系数计算器25根据空间分辨率控制器24给出的指令,生成限制行数的变换矩阵bn0k。具体地,球面谐波系数计算器25生成包含根据设置参数集pqopt(即麦克风阵列11的麦克风单元设置)确定的变换矩阵bk的第1行到第n0(k×max(rs))-th行的矩阵,作为是最终矩阵的变换矩阵bn0k。

基于作为麦克风阵列11的几何信息的设置参数集pqopt和作为空间分辨率控制器24的输出的阶n0(k×max(rs)),针对每个波数k(即,针对每个stft仓),生成该变换矩阵bn0k。

球面谐波系数计算器25基于相对于变换矩阵bn0k获得的伪逆矩阵,并基于时频谱,执行如上所述的公式(3)的计算,并计算球面谐波系数amn(k)。例如,球面谐波系数计算器25使用moore-penrose逆作为变换矩阵bn0k的伪逆矩阵。换言之,计算相对于变换矩阵bn0k的moore-penrose逆,作为变换矩阵bn0k的伪逆矩阵。

球面谐波系数计算器25执行类似于上述公式(3)的计算,并且在该计算中同时执行球面谐波变换(sht)和模式补偿。在这种情况下,模式补偿是对应于在公式(1)中除以bn(kr)的处理,即,将已经执行了球面谐波变换的时频谱除以模式函数(贝塞尔函数)的处理。

注意,此处描述了在获得球面谐波系数amn(k)时同时执行球面谐波变换和模式补偿的示例,但是球面谐波变换和模式补偿可以分开执行。

在这种情况下,球面谐波系数计算器25设置有用于执行球面谐波变换的处理块和用于执行模式补偿的处理块。然后,在用于执行球面谐波变换的处理块中,对时频谱执行球面谐波变换,并且在用于执行模式补偿的处理块中,已经执行了球面谐波变换的时频谱除以模式函数(贝塞尔函数)。在此处,在执行球面谐波变换和模式补偿时,执行运算直到由阶n0(k×max(rs))确定的项。

此外,球面谐波系数计算器25将计算的球面谐波系数amn(k)输出(发送)到再现系统。

在再现系统中,基于球面谐波系数计算器25输出的球面谐波系数amn(k),生成用于驱动扬声器阵列14的驱动信号,并且再现声音波面。可以通过校正扬声器阵列14的扬声器特性或者通过使用其他算法,来执行驱动信号的生成。

例如,再现系统的再现装置13包括扬声器设置信息保持部31、驱动信号发生器32、时频合成器33和输出部34。

扬声器设置信息保持部31保持扬声器设置信息,该信息指示包括在扬声器阵列14中的扬声器的设置,并扬声器设置信息保持部将保持的扬声器设置信息提供给驱动信号发生器32。

驱动信号发生器32接收由球面谐波系数计算器25发送的球面谐波系数amn(k),基于接收的球面谐波系数amn(k)和由扬声器设置信息保持部31提供的扬声器设置信息生成驱动信号,并将生成的驱动信号提供给时频合成器33。

例如,驱动信号发生器32执行上述公式(2)的计算,并且计算表示声压的信号,作为时频域中的驱动信号。注意,在公式(2)的计算中,作为再现声音波面的区域的再现区域的半径值被用作半径rq。

此外,在公式(2)的计算中,同时执行球面谐波系数amn(k)乘以贝塞尔函数(即,在球面谐波域中生成驱动信号)、以及关于所生成的驱动信号的逆球面谐波变换(isht)。然而,可以在生成球面谐波域中的驱动信号之后执行逆球面谐波变换。在这种情况下,驱动信号发生器32设置有用于在球面谐波域中生成驱动信号的处理块、和用于执行逆球面谐波变换的处理块。

时频合成器33对由驱动信号发生器32提供的驱动信号执行逆短时傅立叶变换(istft),并将作为执行逆短时傅立叶变换的结果而获得的时域中的驱动信号提供给输出部34。

输出部34对由时频合成器33提供的驱动信号执行数模转换,并将作为执行数模转换结果而获得的模拟驱动信号提供给扬声器阵列14。扬声器阵列14基于由输出部34提供的驱动信号输出声音,以再现由记录系统记录的声音波面。

例如,通过矩形设置线性扬声器阵列而获得扬声器阵列14,通过线性设置扬声器而获得每个线性扬声器阵列,并且位于扬声器阵列14内部的区域是波面的再现区域。注意,扬声器阵列14可以具有任何形状,即,扬声器阵列14可以具有任何扬声器设置。

<记录处理的描述>

接下来,描述图13所示的记录系统和再现系统的操作。

首先,参考图14的流程图描述由记录系统执行的记录处理。注意,在记录处理开始之前,由参数保持部23或另一处理块预先确定设置参数集pqopt,并且作为确定结果而获得的设置参数集pqopt由参数保持部23保持。

在步骤s11中,空间分辨率控制器24基于由参数保持部23提供的设置参数集pqopt来控制空间分辨率。

例如,空间分辨率控制器24执行例如上述公式(9)的计算,以计算阶n0(k×max(rs)),将计算的阶n0(k×max(rs))提供给球面谐波系数计算器25,并指示球面谐波系数计算器25限制变换矩阵bk的行数。

在步骤s12中,麦克风阵列11使用麦克风单元收集环境声音,并将作为收集结果而获得的多声道信号提供给输入部21。输入部21对麦克风阵列11提供的多声道信号执行ad转换,并且将已经执行了ad转换的多声道信号提供给时频分析仪22。

在步骤s13中,时频分析仪22对由输入部21提供的多声道信号执行短时傅立叶变换,并将作为执行短时傅立叶变换的结果而获得的时频谱提供给球面谐波系数计算器25。

在步骤s14中,球面谐波系数计算器25基于来自时频分析仪22的时频谱、来自参数保持部23的设置参数集pqopt以及来自空间分辨率控制器24的阶n0(k×max(rs)),来计算球面谐波系数amn(k)。

换言之,球面谐波系数计算器25根据空间分辨率控制器24给出的指令,基于阶n0(k×max(rs))生成变换矩阵bn0k,并计算生成的变换矩阵bn0k的伪逆矩阵。然后,球面谐波系数计算器25基于获得的伪逆矩阵和时频谱执行类似于公式(3)的计算,并计算球面谐波系数amn(k)。

球面谐波系数计算器25输出如上所述计算的球面谐波系数amn(k),并且记录处理终止。

如上所述,记录系统使用具有根据设置参数集pqopt确定的形状(麦克风单元设置)的麦克风阵列11记录波面,并且使用通过控制空间分辨率获得的变换矩阵来计算球面谐波系数amn(k)。这使得能够以低成本执行宽带声场记录。

<再现处理的描述>

接下来,参考图15的流程图描述由再现系统执行的再现处理。当再现装置13的驱动信号发生器32接收到由记录系统发送的球面谐波系数amn(k)时,再现处理开始。

在步骤s41中,驱动信号发生器32基于接收到的球面谐波系数amn(k)和由扬声器设置信息保持部31提供的扬声器设置信息生成驱动信号,并将生成的驱动信号提供给时频合成器33。例如,在步骤s41中,执行上述公式(2)的计算,并且计算指示声压的信号,作为时频域中的驱动信号。

在步骤s42中,时频合成器33对由驱动信号发生器32提供的驱动信号执行逆短时傅立叶变换,并将作为执行逆短时傅立叶变换的结果而获得的时域中的驱动信号提供给输出部34。此外,输出部34对由时频合成器33提供的驱动信号执行da转换,并将作为执行da转换的结果而获得的模拟驱动信号提供给扬声器阵列14。

在步骤s43中,扬声器阵列14基于由输出部34提供的驱动信号输出声音,以再现由记录系统记录的声音波面,并且再现处理终止。

如上所述,再现系统根据接收的球面谐波系数amn(k)生成驱动信号,并基于生成的驱动信号再现声音波面。再现系统使得可以通过基于从记录系统接收的球面谐波系数amn(k)再现波面,来执行宽带波面再现。

<计算机的配置示例>

顺便说一下,可以使用硬件或软件来执行上述一系列处理。当使用软件执行一系列处理时,包括软件的程序安装在计算机上。在此处,计算机的示例包括结合到专用硬件中的计算机、以及能够通过安装在其上的各种程序来执行各种功能的计算机,例如,通用个人计算机。

图16是使用程序执行上述一系列处理的计算机的硬件配置的示例的框图。

在计算机中,中央处理单元(cpu)501、只读存储器(rom)502和随机存取存储器(ram)503通过总线504相互连接。

此外,输入/输出接口505连接到总线504。输入部506、输出部507、记录部508、通信部509和驱动器510连接到输入/输出接口505。

输入部506包括例如键盘、鼠标、麦克风阵列和成像元件。输出部507包括例如显示器和扬声器阵列。记录部508包括例如硬盘和非易失性存储器。通信部509包括例如网络接口。驱动器510驱动可移动记录介质511,例如,磁盘、光盘、磁光盘或半导体存储器。

在具有上述配置的计算机中,例如,cpu501经由输入/输出接口505和总线504将存储在记录部508中的程序加载到ram503中并执行该程序,从而执行上述一系列处理。

例如,可以通过存储在用作例如封装介质的可移动记录介质511中来提供由计算机(cpu501)执行的程序。此外,可以经由有线或无线传输介质(例如,局域网、互联网或数字卫星广播)提供该程序。

在计算机中,程序可以通过安装在驱动器510上的可移动记录介质511经由输入/输出接口505安装在记录部508上。此外,可以由通信部509经由输入/输出接口505接收程序,以安装在记录部508上。此外,程序可以预先安装在rom502或记录部508上。

注意,由计算机执行的程序可以是以本文描述的顺序按时间顺序执行处理的程序,或者可以是并行执行处理或者在必要的时间(例如,调用的时间)执行处理的程序。

此外,本技术的实施方式不限于上述示例,并且在不脱离本技术的范围的情况下,可以对其进行各种修改。

例如,本技术还可以具有云计算的配置,其中,多个装置共享单个功能的任务,并且经由网络协作以执行单个功能。

此外,除了由单个装置执行之外,使用上述流程图描述的各个步骤可以由要执行的多个装置共享。

此外,当单个步骤包括多个处理时,除了由单个装置执行之外,单个步骤中包括的多个处理可以由要执行的多个装置共享。

此外,本技术还可以采用以下配置。

(1)一种用于声场记录的麦克风阵列,包括:

多个子阵列,每个子阵列包括多个麦克风,并且每个子阵列具有包括指定半径的离散旋转对称形状,其中,

当多个子阵列的半径值形成数列时,数列是广义算术数列。

(2)根据(1)的麦克风阵列,其中,

包括在子阵列中的多个麦克风中的每一个被设置成远离麦克风阵列的中心位置一段距离,该距离对应于子阵列的半径。

(3)根据(1)或(2)的麦克风阵列,其中,

当对多个子阵列中的一个执行放大操作、缩小操作、旋转操作或反转操作中的至少一项时,多个子阵列中的一个与多个子阵列中的另一个一致。

(4)根据(1)至(3)中任一项的麦克风阵列,其中,

多个麦克风被设置成使得当包括在麦克风阵列中的多个麦克风的所有麦克风径向投影到以麦克风阵列的中心位置为中心的环形上时,多个麦克风的投影麦克风在环形上等距隔开。

(5)根据(1)至(4)中任一项的麦克风阵列,其中,

包括在麦克风阵列中的多个麦克风中的所有麦克风都是全向麦克风,或者包括在麦克风阵列中的多个麦克风中的至少一个不是全向麦克风。

(6)一种记录装置,包括

球面谐波系数计算器,基于由用于声场记录的麦克风阵列执行的声音收集所获得的多声道信号来计算球面谐波系数,麦克风阵列包括多个子阵列,每个子阵列包括多个麦克风,并且每个子阵列具有包括指定半径的离散旋转对称形状,其中,

当多个子阵列的半径值形成数列时,数列是广义算术数列。

(7)根据(6)的记录装置,其中,

球面谐波系数计算器通过执行模式补偿来计算球面谐波系数。

(8)根据(7)的记录装置,还包括

空间分辨率控制器,基于球面谐波域的特定阶,限制用于执行模式补偿的变换矩阵的行数。

(9)根据(8)的记录装置,其中,

空间分辨率控制器基于多个子阵列的半径的最大值来确定特定阶。

(10)根据(8)或(9)的记录装置,其中,

球面谐波系数计算器通过执行模式补偿,基于限制行数的变换矩阵的伪逆矩阵、和多声道信号来计算球面谐波系数。

(11)一种记录方法,包括

由记录装置基于由用于声场记录的麦克风阵列执行的声音收集所获得的多声道信号,来计算球面谐波系数,麦克风阵列包括多个子阵列,每个子阵列包括多个麦克风,并且每个子阵列具有包括指定半径的离散旋转对称形状,其中,

当多个子阵列的半径值形成数列时,该数列是广义算术数列。

(12)一种程序,使计算机执行处理,包括:

基于由用于声场记录的麦克风阵列执行的声音收集所获得的多声道信号,来计算球面谐波系数,麦克风阵列包括多个子阵列,每个子阵列包括多个麦克风,并且每个子阵列具有包括指定半径的离散旋转对称形状,其中,

当多个子阵列的半径值形成数列时,该数列是广义算术数列。

附图标记列表

11麦克风阵列

12记录装置

22时频分析仪

23参数保持部

24空间分辨率控制器

25球面谐波系数计算器。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1