双耳声强差ild临界感知特性的测量方法及其装置的制作方法

文档序号:6028126阅读:416来源:国知局
专利名称:双耳声强差ild临界感知特性的测量方法及其装置的制作方法
技术领域
本发明涉及一种双耳声强差临界感知特性的测量方法及其装置,更具体 地,涉及空间音频编码中提取的双耳声强差参数的临界感知特性的测量方法及 其装置。
背景技术
在空间音频编码技术里,空间参数表达了多声道(含立体声)音频中蕴涵 的空间信息。双耳声强差(Interaural Level Difference,以下简称ILD)是众多 空间参数中较为重要的一个,它表达了声道间强度差对声源方向定位的影响。 简单说来,如果左耳感受到的声音强度比右耳的大,那么听音人会觉得声音来 自左侧方向,反之亦然。双耳声强差是听觉系统辨别声源方位的重要依据之一。当前空间心理声学研究表明,人耳对ILD的感知存在着掩蔽效应。也就是 说,当ILD值变化到一个临界范围之内时,人耳已经不能感知到声源方向的变 化。该临界值称为ILD临界感知阈值(Just noticeable difference,以下简称JND), 它描述了人耳恰可感知的ILD的临界值,也称为ILD绝对阈值。在绝对阈值 之下的ILD值不能被人耳感知到,这种现象称为绝对掩蔽。人的听觉系统对于 不同操作单元上的ILD存在着感知差异,也就是说在不同频率下,ILD绝对阈 值是有差异的。然而当前对空间音频参数ILD的研究并没有对其临界感知特性在全频带 进行分析,也就是说,对ILD参数在不同频率和不同响度下表现出的感知特性 差异也还没有定量的描述。在现有的空间音频编码中,对ILD的处理方法包括两类 一类是在整个信号频率范围内对各操作单元(如各个划分的子带)的ILD 都进行编码;另一类是为降低编码的参数码率,忽略ILD对编码音质的影响而 不对其进行编码。这两类的处理方法,要么忽略了 ILD在不同操作单元具有的 感知差异,浪费了参数编码码率,要么以编码音质的下降为代价而不处理双耳 对强度差异的感知信息,从而使得编码信号中存在大量无法去除的主观冗余信 息,降低编码压縮效率。

发明内容
本发明依据人耳的听觉特性,提出一种分频带测量ILD临界感知特性的方 法及其装置,目的在于指导空间音频编码,有效去除当前空间参数主观冗余难 以去除的难题。本发明中频率覆盖的范围是20Hz到20KHz。该方法将音频信 号划分为若干子带,依据附图2所示的ILD调整的原理图,对每个原始音,通 过增益控制器gi和g2,制作给定ILD下的立体测试音。通过主观测听获得各 子带上ILD临界阈值,得出相应的JND曲线。
本发明的解决方案包括以下步骤
一种双耳声强差ILD临界感知特性的测量方法,其特征在于,包括以下步

步骤l、由响度选取单元确定各个响度级选取,由频率选取单元确定频带 划分规则以及所有测试音的频率;
步骤2、由原始音制作单元将步骤1中选取的响度换算成声压级,并根据 步骤(1)中选取的频率和本步骤换算后的声压级制作各响度级以及各频率下 的原始音;步骤3、输入各响度级各频率下的原始音,由ILD测试序列制作单元对每 个原始音设定至少两个ILD值,制作测试序列,其中一个ILD值对应参考音, 其他作为测试音。
步骤4、测试者对步骤3中所有测试序列进行主观测试,记录其感知到声 源方向发生变化的临界测试音。
在上述的双耳声强差ILD临界感知特性的测量方法,在步骤l中,响度级 在人耳听觉域内选取,听觉域范围为20Hz 20KHz,频带划分采用Bark带划 分规则,测试音频率选取每个Bark带中心频率。
在上述的双耳声强差ILD临界感知特性的测量方法,在步骤3中,所述的 对原始音设定的ILD值,正值代表左声道比右声道强,负值代表右声道比左声 道强,参数设置为ILD=0的测试音作为参考音。
在上述的双耳声强差ILD临界感知特性的测量方法,在步骤3中,对每个 原始音制作测试音和参考音时设定双耳时间差ITD=0,耳间相关度K>1。
在上述的双耳声强差ILD临界感知特性的测量方法,在步骤4中,主观测 试的具体方法为对每个原始音,测试者首先反复对参考音进行声源定位,将 参考音的声源位置确定为中心位置,然后使ILD值从0开始分别向正数和负数 两边逐渐变化,并对相应的测试音进行测听。
在上述的双耳声强差ILD临界感知特性的测量方法,所述步骤4中所述记 录测试者感知到声源方向发生变化的临界测试音的具体方法为如下选择记录 人耳感觉测试音与参考音声源方向是相同的,比对结果记录为0; 人耳感知到了测试音与参考音声源方向不同,则比对结果记录为1; 测试者对所有原始音测听结束后,记录下结果为0和1的交界处且记录为1的两个测试序列的ILD值,取这两个值的绝对值平均,作为ILD临界值。在上述的双耳声强差ILD临界感知特性的测量方法,所述的步骤4完成后, 由统计分析单元对所有频率和响度的ILD临界值做统计分析,获取JND曲线族。一种用于双耳声强差ILD临界感知特性的测量方法的装置,其特征在于 它包括频率选取单元以及分别与频率选取单元相连的响度选取单元和原始音 制作单元,ILD测试序列制作单元与原始音制作单元相连,统计分析单元与ILD 测试序列制作单元相连。说明书附图

图1为本发明中双耳声强差ILD的听觉模型; 图2为本发明中ILD调整原理图; 图3为本发明中测试序列制作流程; 图4为本发明中主观测听流程;图5为本发明中传统参数编码模型与参数临界感知编码模型比较图;
具体实施例方式本发明提供一种测量双耳声强差ILD在不同响度级不同频率下的临界感知特性的方法,包括以下步骤(1)由响度选取单元确定各个响度级选取,由频率选取单元确定频带划 分规则以及所有测试音的频率;本步骤是确定频带划分规则以及所有测试音的频率,确定实验需要测试的各个响度级。釆用巴克带的划分规则,将全频带划分为24个巴克带,选取每 个巴克带的中心频率作为测试音的频率;
(2) 由原始音制作单元将步骤(1)中选取的响度换算成声压级,并根据 步骤(1)中选取的频率和本步骤换算后的声压级制作各响度级以及各频率下 的原始音;
(3) 输入各响度级各频率下的原始音,由ILD测试序列制作单元对每个 原始音设定至少两个ILD值,制作测试序列。其中一个ILD值对应参考音, 其他作为测试音。
本步骤中,对每个原始音设定不同的ILD值,其值覆盖范围为-9~9,制作 对应不同ILD值的参考音与测试音。ILD值的设定通常以1为步长,取值-9, -8, -7, -6, -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9,共生成18 个测试音与1个参考音。也可根据每个频带上人耳的感知特性对ILD值做调整, 采取非线性形式设定ILD值。参考音的参数设置为ILD=0, ITD=0,
(4) 测试者对步骤(3)中所有原始音进行主观测试,记录其感知到声源 方向发生变化的临界测试音。主观测试的具体方法为对每个原始音,测试者 首先反复对参考音进行声源定位,将参考音的声源位置确定为中心位置,然后 使ILD值由0开始分别向两边逐步递增到-9和9,并按照此顺序对测试音进行 测听。测试者首先反复试听参考音,确定声源中心位置,然后分别对每个响度 级下每个频带的所有测试音进行试听,判断声源的方向。如附图1所示,参考 音的声源处在中心位置,其ILD参数值为O。测试音声源的方向是从中心位置 向两侧渐变,测试者在依顺序测听的过程中,需要判断双耳刚好分辨不出声源 方向的临界序列,记录下其对应的左耳和右耳的两个ILD临界值;
记录测试者感知到声源方向发生变化的临界测试音的具体方法为如下选择记录
人耳感觉测试音与参考音声源方向是相同的,比对结果记录为0; 人耳感知到了测试音与参考音声源方向不同,则比对结果记录为1; 测试者对所有原始音测听结束后,记录下结果为0和1交界处且记录为1
的测试序列的ILD值,通常为一正一负两个值。取两者的绝对值平均值作为ILD
临界值。
步骤(4)完成后,由统计分析单元对所有频率和响度的ILD临界值做统 计分析,即对各个响度级各个巴克带上所有测试者的ILD临界值结果做算数平 均,得出其平均值,用直线连接即得出各响度级下的JND曲线。
一种用于权利要求1所述的方法的装置,其特征在于它包括频率选取单 元以及分别与频率选取单元相连的响度选取单元和原始音制作单元,ILD测试 序列制作单元与原始音制作单元相连,统计分析单元与ILD测试序列制作单元 相连。附图5所示为传统参数编码模型与参数临界感知编码模型比较图。
传统的参数编码模型中,信号经过变换模块后进行子带划分,分为64个 子带。再对子带进行分组,通常分为10或20组。在参数编码模块中,所有的 ILD参数采取全部编码或者全部不编码的策略。这两类的处理方法,要么忽略 了ILD在不同操作单元具有的感知差异,浪费了参数编码码率,要么以编码音 质的下降为代价而不处理双耳对强度差异的感知信息,从而使得编码信号中存 在大量无法去除的主观冗余信息,降低编码压縮效率。
本发明的ILD临界感知模型可对传统参数编码模型进行改进。如参数临界感知 编码模型所示,信号经过变换模块后,进入巴克划分模块将信号分为24个巴 克带。在感知分组模块中,对于每一桢信号,需要编码判决模块对其进行判决,根据参数的临界感知统计特性决定是否需要进行编码。此过程不断循环进行。随着信号的帧数不断增加,感知分组结果越精细。最后输出需要进行ILD参数 编码的N组信号。在编码与判决模型中,对这N组信号的ILD值进行编码。 每一组内的ILD通过阈值判决模块决定其编码值以及码率分配。改编码方法不 仅考虑到人耳的感知听觉特性,避免造成编码音质的严重下降,同时降低了参 数的冗余,可以有效的提高编码效率。空间心理声学指出,双耳声强差ILD在不同的频带下有不同的临界感知 特性。 一般来说,在中频和高频部分,人耳对ILD的感知会比较敏感,而在低 频和超高频部分,人耳对ILD的感知特性相对不敏感。同时,不同响度级下ILD 的临界感知特性也有所不同。通常来讲,人耳在响度级较高的情况下对ILD的 感知特性要更敏感一些。人耳存在一个较大的的听觉域,听觉频率范围一般为20Hz到20kHz,超 过此频率范围的声音通常难以被人耳感知到。而在听觉范围内的不同频率下, 人耳对声压级的可感知度也有所不同。当声音的强弱小到人的耳朵刚刚可听见时,称为听阈。它是稳态环境下纯音的可听觉水平,代表了不同频率下人耳可 感知的最低声压级。即是在绝对安静的环境下,人耳也感知不到听阈之下的声 压级范围。如果加大声音的强度,使它大到人的耳朵感到疼痛,这个阈值称为 痛阈。在听阈和痛阈之间的区域就是人耳的听觉域。人耳听觉域是相当宽的, 从声强上来看,相差1012倍以上。响度是人耳听觉判别声音强度的等级概念。由于听觉具有复杂的强度特 性,频率特性及时间特性,所以响度不仅取决于声压级,还与频率及瞬态时间 特性有关。依据上述特点,在实验中设定响度曲线时应充分考虑人耳的听觉特性,选取具有代表性的若干响度值进行实验。首先在人耳听觉域之内选定若干个响 度,再与频率关联计算出各频带中心频率的声压级。声压级与频率确定后,可 用于生成测试序列。
下面结合附图2,附图3和附图4对本发明实施例做进一步的说明,以便 具体实施参考。
本发明实施例分频带参数提取系统包括二个模块测试序列生成模块,如 附图3所示,和主观实验模块,如附图4所示。
附图2的ILD原理图中,单频音信号S(t)通过两个不同的增益控制器g,与g2, 使得进入左右耳的两个声道信号分别为左耳g^S(t)和右耳为g户S(t)。此时的立 体声信号为具有给定声强差的测试音,即对应不同ILD值的测试音。
具体实施过程中,如附图3的测试序列生成图所示,将输入信号的能量恒定 式(公式l),结合ILD的定义式(公式2),可获得增益控制器gi的计算式(公式 3)和g2的计算式(公式4),
<formula>formula see original document page 11</formula>
本实施例中的测试序列包括参考音和测试音。在第三步测试序列的制作
中,保证始终只有ILD —个参数在发生变化,其它影响空间听觉的参数,如ITD 值和IC值始终保持在中心位置不变,本实例中参考音是ILD=0, ITD=0, IC=1。 测试音nXNO, IC=1, ILD在[-9,9]之间,以步长1变化。
附图4的主观测听流程中,测试者对所有参考音和测试音进行主观测听。首先测试者要反复对参考音进行声源定位,将参考音的声源位置确定为中心位
置。然后使ILD值逐渐增大,按顺序对测试音进行测听。当ILD值比较小时, 人耳不容易听出测试音与参考音在声源方向上的差别。当人耳感觉测试音与参
考音声源方向是相同的,比对结果记录为0;当人耳感知到测试音与参考音声 源方向不同,则比对结果记录为l;测试者对所有原始音测听结束后,记录下 结果为0和1交界处且记录为1的测试序列的ILD值,通常为一正一负两个值。 取两者的绝对值平均值作为ILD临界值。
对所有频率所有响度的测试序列都按如上方法进行测试,统计所有测试数 据可绘制双耳声强差ILD的JND曲线。
权利要求
1.一种双耳声强差ILD临界感知特性的测量方法,其特征在于,包括以下步骤步骤1、由响度选取单元确定各个响度级选取,由频率选取单元确定频带划分规则以及所有测试音的频率;步骤2、由原始音制作单元将步骤1中选取的响度换算成声压级,并根据步骤1中选取的频率和本步骤换算后的声压级制作各响度级以及各频率下的原始音;步骤3、输入各响度级各频率下的原始音,由ILD测试序列制作单元对每个原始音设定至少两个ILD值,制作测试序列,其中一个ILD值对应参考音,其他作为测试音。步骤4、测试者对步骤3中所有测试序列进行主观测试,记录其感知到声源方向发生变化的临界测试音。
2. 根据权利要求1所述的双耳声强差ILD临界感知特性的测量方法,其特征 在于在步骤1中,响度级在人耳听觉域内选取,听觉域范围为20Hz 20KHz, 频带划分采用Bark带划分规则,测试音频率选取每个Bark带中心频率。
3. 根据权利要求1所述的双耳声强差ILD临界感知特性的测量方法,其特征 在于在步骤3中,所述的对原始音设定的ILD值,正值代表左声道比右声道 强,负值代表右声道比左声道强,参数设置为ILD=0的测试音作为参考音。
4. 根据权利要求3所述的双耳声强差ILD临界感知特性的测量方法,其特征 在于在步骤3中,对每个原始音制作测试音和参考音时设定ITD=0, IC=1。
5. 根据权利要求1所述的双耳声强差ILD临界感知特性的测量方法,其特征 在于在步骤4中,主观测试的具体方法为对每个原始音,测试者首先反复对参考音进行声源定位,将参考音的声源位置确定为中心位置,然后使ILD值 从0开始分别向正数和负数两边逐渐变化,并对相应的测试音进行测听。
6. 根据权利要求5所述的双耳声强差ILD临界感知特性的测量方法,其特征 在于所述步骤4中所述记录测试者感知到声源方向发生变化的临界测试音的 具体方法为如下选择记录人耳感觉测试音与参考音声源方向是相同的,比对结果记录为0; 人耳感知到了测试音与参考音声源方向不同,则比对结果记录为1; 测试者对所有原始音测听结束后,记录下结果为0和1的交界处的两个记录为1的测试序列的ILD值,取两者的绝对平均值作为ILD临界值。
7. 根据权利要求1所述的双耳声强差ILD临界感知特性的测量方法,其特征 在于所述的步骤4完成后,由统计分析单元对所有频率和响度的ILD临界值 做统计分析,获取JND曲线族。
8. —种用于权利要求1所述的方法的装置,其特征在于它包括频率选取单 元以及分别与频率选取单元相连的响度选取单元和原始音制作单元,ILD测试序 列制作单元与原始音制作单元相连,统计分析单元与ILD测试序列制作单元相 连。
全文摘要
在空间音频编码中,双耳声强差是听觉系统辨别声源方位的重要参数之一。本发明公开了双耳声强差(以下简称ILD)参数的临界感知特性的测量方法对测试源采用巴克频带的划分规则,选取各巴克频带的中心频率作为原始音频率,同时原始音保持声压级恒定;接着依据ILD的感知原理,通过等间距或非线性变化ILD值的方法制作听音位置渐变的测试音;最后通过主观测试的方法,获取ILD参数的临界感知值JND。本发明实现了频率从20Hz至20KHz信号的ILD临界感知特性的定量分析,解决了传统ILD特性分析中仅有定性描述的缺陷,以及空间音频编码中ILD参数的主观冗余去除的问题,利于优化分析。
文档编号G01S5/00GK101408614SQ200810197889
公开日2009年4月15日 申请日期2008年11月26日 优先权日2008年11月26日
发明者刘雨田, 胡瑞敏, 陈文琴, 陈水仙 申请人:武汉大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1