双耳时间差itd临界感知特性的测量方法及其装置的制作方法

文档序号:6028127阅读:307来源:国知局
专利名称:双耳时间差itd临界感知特性的测量方法及其装置的制作方法
技术领域
本发明涉及一种双耳时间差临界感知特性的测量方法及其装置,更具体 地,涉及空间音频编码中提取的双耳时间差参数的临界感知特性的测量方法及 其装置。
背景技术
在空间音频编码技术里,空间参数表达了多声道含立体声音频中蕴涵的空 间信息。双耳时间差Interaural Time Difference,以下简称ITD是众多空间参数 中较为重要的一个,它表达了声道间时间差对声源方向定位的影响。简单说来, 从声源发出的声音到达人的左耳和右耳时,有一个先后的过程,这段时间差就 是双耳时间差。它的原理是如果一个声音到达双耳的时间是同时的,那么听 者就觉得这个声音处在正中间的位置;倘若声音到达左耳先于到达右耳,听者 人就觉得声源偏左,反之亦然。ITD是听觉系统辨别声源方位的重要依据之一。
当前空间心理声学研究表明,人耳对ITD的感知存在着掩蔽效应。也就是 说,当ITD值变化到一个临界范围之内时,人耳已经不能感知到声源方向的变 化。该临界值称为ITD临界感知阈值Just noticeable difference,以下简称JND, 它描述了人耳恰可感知的ITD的临界值,也称为ITD绝对阈值。在绝对阈值 之下的ITD值不能被人耳感知到,这种现象称为绝对掩蔽。人的听觉系统对于 不同操作单元上的ITD存在着感知差异,也就是说在不同频率下,ITD绝对阈 值是有差异的。
然而当前对空间音频参数ITD的研究并没有对其临界感知特性在全频带进行分析,也就是说,对ITD参数在不同频率和不同响度下表现出的感知特性 差异也还没有定量的描述。在现有的空间音频编码中,对ITD的处理方法包括 两类 一类是在整个信号频率范围内对各操作单元如各个划分的子带的ITD都 进行编码;另一类是为降低编码的参数码率,忽略ITD对编码音质的影响而不 对其进行编码。这两类的处理方法,要么忽略了ITD在不同操作单元具有的感 知差异,浪费了参数编码码率,要么以编码音质的下降为代价而不处理双耳对 强度差异的感知信息,从而使得编码信号中存在大量无法去除的主观冗余信 息,降低编码压縮效率。

发明内容
本发明依据人耳的听觉特性,提出一种分频带测量ITD临界感知特性的方 法及其装置,目的在于指导空间音频编码,如附图5的空间音频编解码流程图 所示,在编码端以空间心理声学模型以及ITD临界感知特性为指导提取ITD 参数,可以有效去除当前空间参数主观冗余难以去除的难题。本发明中频率覆 盖的范围是20Hz到20KHz。该方法将音频信号划分为若干子带,依据附图2 所示的ITD调整的原理图,对每个原始音,通过延时控制器^和t2,制作给定 ITD下的立体测试音。通过主观测听获得各子带上ITD临界阈值,得出相应的 JND曲线。
本发明的解决方案包括以下步骤
一种双耳时间差ITD临界感知特性的测量方法,其特征在于,包括以下步骤
步骤l、由响度选取单元确定各个响度级选取,由频率选取单元确定频带划分规则以及所有测试音的频率;步骤2、由原始音制作单元将步骤1中选取的响度换算成声压级,并根据 步骤l中选取的频率和本步骤换算后的声压级制作各响度级以及各频率下的原
始音;
步骤3、输入各响度级各频率下的原始音,由ITD测试序列制作单元对每 个原始音设定至少两个ITD值,制作测试序列,其中一个ITD值对应参考音, 其他作为测试音;
步骤4、测试者对步骤3中所有测试音进行主观测试,记录其感知到声源 方向发生变化的临界测试音。
在上述的双耳时间差ITD临界感知特性的测量方法,在步骤l中,响度级 在人耳听觉域内选取,听觉域范围为20Hz 20KHz,频带划分采用Bark带划 分规则,测试音频率选取在每个Bark带频率内的白噪声。
在上述的双耳时间差ITD临界感知特性的测量方法,在步骤3中,所述的 对每个原始音设定的ITD值,正值代表左声道比右声道领先时间,负值代表右 声道比左声道领先时间,生成所有测试音,其中参数设置为nrx)的测试音作 为参考音。
在上述的双耳时间差ITD临界感知特性的测量方法,制作测试音和参考音 时双耳声强差ILD,耳间相关度IC为固定值。
在上述的双耳时间差ITD临界感知特性的测量方法,在步骤4中,主观测 试的具体方法为对每个原始音,测试者首先反复对参考音进行声源定位,将 参考音的声源位置确定为中心位置,然后使ITD值从0开始分别向正数和负数 两边逐渐变化,并对相应的测试音进行测听。
在上述的双耳时间差ITD临界感知特性的测量方法,所述步骤4中所述记录测试者感知到声源方向发生变化的临界测试音的具体方法为如下选择记录
人耳感觉测试音与参考音声源方向是相同的,比对结果记录为0;
人耳感知到了测试音与参考音声源方向不同,则比对结果记录为1;
测试者对所有原始音测听结束后,记录下结果为0和1的交界处的两个记 录为1的测试序列的ITD值,取这两个值的绝对值平均,作为ITD临界值。
在上述的ITD临界感知特性测量方法,所述的步骤4完成后,由统计分析 单元对所有频率和响度的ITD临界值做统计分析,获取JND曲线族。 一种用于双耳时间差ITD临界感知特性的测量方法的装置,其特征在于它包
括频率选取单元以及分别与频率选取单元相连的响度选取单元和原始音制作 单元,ITD测试序列制作单元与原始音制作单元相连,统计分析单元与ITD测
试序列制作单元相连。
说明书附图


图1为本发明的双耳时间差ITD的听觉模型; 图2为本发明的ITD调整原理图; 图3为本发明的测试序列制作流程; 图4为本发明的主观测听流程;
图5为本发明的传统参数编码模型与参数临界感知编码模型比较图;
具体实施例方式
本发明提供一种测量双耳时间差ITD在不同响度级不同频率下的临界感 知特性的方法,包括以下步骤-步骤l、由响度选取单元确定各个响度级选取,由频率选取单元确定频带 划分规则以及所有测试音的频率;
在本步骤中,确定频带划分规则以及所有测试音的频率,确定实验需要测 试的各个响度级。采用巴克带的划分规则,将全频带划分为24个巴克带,选 取每个巴克带的中心频率作为测试音的频率;
步骤2、由原始音制作单元将步骤1中选取的响度换算成声压级,并根据 步骤l中选取的频率和本步骤换算后的声压级制作各响度级以及各频率下的原 始音;
步骤3、输入各响度级各频率下的原始音,由ITD测试序列制作单元对每 个原始音设定至少一个ITD值,并制作对应ITD值的参考音与测试音。
在本步骤中,对每个原始音设定不同的ITD值,其值覆盖范围为 -0.5~0.5ms,制作对应不同ITD值的参考音与测试音。ITD值的设定通常以0.1 为步长,取值-0.5, -0.4, -0.3, -0.2, -0.1, 0, 0.1, 0.2, 0.3, 0.4, 0.5。分别 代表左声道领先0.5ms, 0.4ms, 0.3ms, 0.2ms, O.lms,左右声道同步,右 声道领先O.lms, 0.2ms, 0.3ms, 0.4ms, 0.5ms。共生成10个测试音与1个参 考音。也可根据每个频带上人耳的感知特性对ITD值做调整,采取非线性形式 设定ITD值。参考音的参数设置为ITD=0, ILD=0, IC=1;
步骤4、测试者对步骤3中所有原始音进行主观测试,记录其感知到声源 方向发生变化的临界测试音。
在上述的ITD临界感知特性测量方法,在步骤l中,响度级在人耳听觉域 内选取20Hz 20kHz,频带划分采用Bark带划分规则,测试音频率选取每个 Bark带中心频率。步骤3中,所述的对每个原始音设定的ITD值为ll个,其值变化范围覆 盖区间-0.5ms 0.5ms,步长依该频带听觉特性而定,生成所有测试音,其中参 数设置为ITD=0的测试音作为参考音,制作测试音和参考音时始终只有ITD 一个参数在发生变化,其他各参数保持不变,设为IIX^0,IC4。
在步骤4中,主观测试的具体方法为对每个原始音,测试者首先反复对 参考音进行声源定位,将参考音的声源位置确定为中心位置,然后使ITD值由 0开始分别向两边逐步递增到-0.5和0.5,并按照此顺序对测试音进行测听。测 试者首先反复试听参考音,确定声源中心位置,然后分别对每个响度级下每个 频带的所有测试音进行试听,判断声源的方向。如附图1所示,参考音的声源 处在中心位置,其ITD参数值为O。测试音声源的方向是从中心位置向两侧渐 变,测试者在依顺序测听的过程中,需要判断双耳刚好分辨不出声源方向的临 界序列,记录下其对应的左耳和右耳的两个ITD临界值;
记录测试者感知到声源方向发生变化的临界测试音的具体方法为如下选 择记录
人耳感觉测试音与参考音声源方向是相同的,比对结果记录为0;
人耳感知到了测试音与参考音声源方向不同,则比对结果记录为1;
测试者对所有原始音测听结束后,记录下结果为0和1的交界处的两个记 录为1的测试序列的ITD值,通常为一正一负两个值。取两者的绝对值平均值 作为ILD临界值。
步骤4完成后,由统计分析单元对所有频率和响度的ITD临界值做统计分 析,获取JND曲线族。
一种用于双耳时间差ITD临界感知特性的测量方法的装置,其特征在于-它包括频率选取单元以及分别与频率选取单元相连的响度选取单元和原始音制作单元,ITD测试序列制作单元与原始音制作单元相连,统计分析单元与ITD 测试序列制作单元相连。附图5所示为传统参数编码模型与参数临界感知编码模型比较图。传统的 参数编码模型中,信号经过变换模块后进行子带划分,分为64个子带。再对 子带进行分组,通常分为10或20组。在参数编码模块中,所有的ITD参数采 取全部编码或者全部不编码的策略。这两类的处理方法,要么忽略了ITD在不 同操作单元具有的感知差异,浪费了参数编码码率,要么以编码音质的下降为 代价而不处理双耳对强度差异的感知信息,从而使得编码信号中存在大量无法 去除的主观冗余信息,降低编码压縮效率。本发明的ITD临界感知模型可对传统参数编码模型进行改进。如参数临界 感知编码模型所示,信号经过变换模块后,进入巴克划分模块将信号分为24 个巴克带。在感知分组模块中,对于每一桢信号,需要编码判决模块对其进行 判决,根据ITD的临界感知统计特性决定是否需要进行编码。此过程不断循环 进行。随着信号的帧数不断增加,感知分组结果越精细。最后输出需要进行ITD 参数编码的N组信号。在编码与判决模型中,对这N组信号的ITD值进行编 码。每一组内的ITD通过阈值判决模块决定其编码值以及码率分配。该编码方 法不仅考虑到人耳的感知听觉特性,避免造成编码音质的严重下降,同时降低 了参数的冗余,可以有效的提高编码效率。空间心理声学指出,双耳时间差ITD在不同的频带下有不同的临界感知 特性。 一般来说,在低频部分,人耳对ITD的感知会比较敏感,而在高频和超 高频部分,人耳对ITD的感知特性相对不敏感。同时,不同响度级下ITD的 临界感知特性也有所不同。通常来讲,人耳在响度级较高的情况下对ITD的感知特性要更敏感一些。人耳存在一个较大的的听觉域,听觉频率范围一般为20Hz到20kHz,超 过此频率范围的声音通常难以被人耳感知到。而在听觉范围内的不同频率下, 人耳对声压级的可感知度也有所不同。当声音的强弱小到人的耳朵刚刚可听见时,称为听阈。它是稳态环境下纯音的可听觉水平,代表了不同频率下人耳可 感知的最低声压级。即是在绝对安静的环境下,人耳也感知不到听阈之下的声 压级范围。如果加大声音的强度,使它大到人的耳朵感到疼痛,这个阈值称为 痛阈。在听阈和痛阈之间的区域就是人耳的听觉域。人耳听觉域是相当宽的, 从声强上来看,相差1012倍以上。响度是人耳听觉判别声音强度的等级概念。由于听觉具有复杂的强度特 性,频率特性及时间特性,所以响度不仅取决于声压级,还与频率及瞬态时间 特性有关。依据上述特点,在实验中设定响度曲线时应充分考虑人耳的听觉特性,选 取具有代表性的若干响度值进行实验。首先在人耳听觉域之内选定若干个响 度,再与频率关联计算出各频带中心频率的声压级。声压级与频率确定后,可用于生成测试序列。下面结合附图2,附图3和附图4对本发明实施例做进一步的说明,以便 具体实施参考。本发明实施例分频带参数提取系统包括二个模块测试序列生成模块,如 附图3所示,和主观实验模块,如附图4所示。附图2的ITD调整原理图中,单频音信号S(t)通过两个不同的延时控制器t!与 t2,使得进入左右耳的两个声道信号具有给定时间长度的延时。此时的立体声信 号为具有给定时间差的测试音,即对应不同ITD值的测试音。本实施例中的测试序列包括参考音和测试音。在第三步测试序列的制作中,保证始终只有ITD —个参数在发生变化,其它影响空间听觉的参数,如ILD 值和IC值始终保持在中心位置不变,本实例中参考音是ITD=0, ILD=0, IC=1。 的测试音IUX), IOl, ITD在[-0.5,0.5]之间,以步长O.l变化。附图4的主观测听流程中,测试者对所有参考音和测试音进行主观测听。 首先测试者要反复对参考音进行声源定位,将参考音的声源位置确定为中心位 置。然后使ITD值逐渐增大,按顺序对测试音进行测听。当ITD值比较小时, 人耳不容易听出测试音与参考音在声源方向上的差别。当人耳感觉测试音与参考音声源方向是相同的,比对结果记录为O;当人耳感知到测试音与参考音声 源方向不同,则比对结果记录为l;测试者对所有原始音测听结束后,记录下 结果为O和1交界处且记录为1的测试序列的ITD值,通常为一正一负两个值。 取两者的绝对值平均值作为ITD临界值。对所有频率所有响度的测试序列都按 如上方法进行测试,统计所有测试数据可绘制双耳时间差ITD的JND曲线。
权利要求
1.一种双耳时间差ITD临界感知特性的测量方法,其特征在于,包括以下步骤步骤1、由响度选取单元确定各个响度级选取,由频率选取单元确定频带划分规则以及所有测试音的频率;步骤2、由原始音制作单元将步骤1中选取的响度换算成声压级,并根据步骤1中选取的频率和本步骤换算后的声压级制作各响度级以及各频率下的原始音;步骤3、输入各响度级各频率下的原始音,由ITD测试序列制作单元对每个原始音设定至少两个ITD值,制作测试序列,其中一个ITD值对应参考音,其他作为测试音;步骤4、测试者对步骤3中所有测试音进行主观测试,记录其感知到声源方向发生变化的临界测试音。
2. 根据权利要求1所述的双耳时间差ITD临界感知特性的测量方法,其特征 在于在步骤l中,响度级在人耳听觉域内选取,听觉域范围为20Hz 20KHz, 频带划分采用Bark带划分规则,测试音频率选取在每个Bark带频率内的白噪声。
3. 根据权利要求1所述的双耳时间差ITD临界感知特性的测量方法,其特 征在于在步骤3中,所述的对每个原始音设定的ITD值,正值代表左声道比 右声道领先时间,负值代表右声道比左声道领先时间,生成所有测试音,其中 参数设置为ITD=0的测试音作为参考音。
4. 根据权利要求3所述的双耳时间差ITD临界感知特性的测量方法,其特 征在于制作测试音和参考音时ILD, IC为固定值。
5. 根据权利要求1所述的ITD临界感知特性测量方法,其特征在于在步骤4中,主观测试的具体方法为对每个原始音,测试者首先反复对参考音进 行声源定位,将参考音的声源位置确定为中心位置,然后使ITD值从O开始分 别向正数和负数两边逐渐变化,并对相应的测试音进行测听。
6. 根据权利要求5所述的双耳时间差ITD临界感知特性的测量方法,其特 征在于所述步骤4中所述记录测试者感知到声源方向发生变化的临界测试音 的具体方法为如下选择记录人耳感觉测试音与参考音声源方向是相同的,比对结果记录为0; 人耳感知到了测试音与参考音声源方向不同,则比对结果记录为1; 测试者对所有原始音测听结束后,记录下结果为0和1的交界处的两个记 录为1的测试序列的ITD值,取两者的绝对平均值作为ITD临界值。
7. 根据权利要求5所述的双耳时间差ITD临界感知特性的测量方法,其特 征在于所述的步骤4完成后,由统计分析单元对所有频带和响度的ITD临界 值做统计分析,获取JND曲线族。
8. —种用于权利要求1所述的方法的装置,其特征在于它包括频率选取单 元以及分别与频率选取单元相连的响度选取单元和原始音制作单元,ITD测试序 列制作单元与原始音制作单元相连,统计分析单元与ITD测试序列制作单元相 连。
全文摘要
在空间音频编码中,双耳时间差是听觉系统辨别声源方位的重要参数之一。本发明公开了双耳时间差(以下简称ITD)参数的临界感知特性的测量方法对测试源采用巴克频带的划分规则,选取各巴克频带的中心频率作为原始音频率,同时原始音保持声压级恒定;接着依据ITD的感知原理,通过等间距或非线性变化ITD值的方法制作听音位置渐变的测试音;最后通过主观测试的方法,获取ITD参数的临界感知值JND。本发明实现了频率从20Hz至20KHz信号的ITD临界感知特性的定量分析,解决了传统ITD特性分析中仅有定性描述的缺陷,以及空间音频编码中ITD参数的主观冗余去除的问题,利于优化分析。
文档编号G01S5/00GK101408615SQ200810197890
公开日2009年4月15日 申请日期2008年11月26日 优先权日2008年11月26日
发明者刘雨田, 涂卫平, 恒 王, 胡瑞敏, 陈文琴, 陈水仙 申请人:武汉大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1