3d音频中水平方位参数的编解码性能评价方法

文档序号:2829069阅读:319来源:国知局
专利名称:3d音频中水平方位参数的编解码性能评价方法
技术领域
本发明涉及失真测度领域,更具体地,涉及3D音频中水平方位参数的编解码性能评价方法。
背景技术
3D音频编解码技术是当今多媒体技术领域的热点和发展方向。3D音频的基本原理是通过模拟空间点声源在人耳产生的声场,使听者感觉声音从空间某声源对应位置发出。其中,主要由双耳效应完成对声源水平方位信息的判断,因此3D音频中水平方位信息的获取和处理技术又称为双耳声学技术。为了理解双耳声学技术,首先必须了解人耳定位的基本原理。空间某声源发出的声音传递到人的两耳,因为传播路径的不同,会产生差异,主要有时间差(ITD,interauraltime difference)和强度差(ILD, interaural level difference),并且声音在传递过程中会与人的躯干、肩膀、头部以及耳廓发生一系列的相互作用,使声音改变,人耳则根据声音到达两耳的时间、强度等差别来确定声源的水平位置。通常将ITD、ILD等表现声源水平位置信息的参数成为水平方位参数。根据这一原理,在对3D音频进行编解码的过程中,将ITD、ILD等能表示声源方位信息的参数提取出来进行处理,实现编解码后的信号能通过这些参数模拟声源位置。失真,是评价3D音频编解码性能的一项重要指标,它体现了编解码后信号与原始信号的差距。失真的值越小,编解码性能越好。目前在3D音频编解码技术领域,对声源方位信息编解码效果的评价使用的是统计学失真,如均方误差(加权平方误差、谱失真测度、
N
倒谱失真测度)等。均方误差是各数值偏离目标值距离的平均数,其公式为
权利要求
1.3D音频中水平方位參数的编码性能评价方法,其特征在于 将水平方位參数及其JND值引入统计学失真測度中构建主观感知失真測度,利用所构建的主观感知失真测度进行3D音频中水平方位參数的编解码性能评价。
2.根据权利要求I所述的3D音频中水平方位參数的编码性能评价方法,其特征在干,进步包括如下子步骤 步骤I、将一段音频中的各帧信号划分为N个频帯,即得到N个子带; 步骤2、提取各子带编解码前的水平方位參数值; 步骤3、提取各子带编解码后的水平方位參数值; 步骤4、根据各子带的频率值,获取各子带对应的JND值; 步骤5、以统计学失真測度为基础,根据各子带编解码前的水平方位參数值、各子带编解码后的水平方位參数值和各子带对应的JND值构建每ー帧信号的主观感知失真測度;步骤6、根据各帧信号的主观感知失真测度获取一段音频中各帧信号的主观感知失真,井根据各帧信号的主观感知失真得到该段音频的主观感知失真,从而评价编解码器的水平方位參数的主观感知失真。
3.根据权利要求I或2所述的3D音频中水平方位參数的编码性能评价方法,其特征在于 所述的主观感知失真测度D为
4.根据权利要求I或2所述的3D音频中水平方位參数的编码性能评价方法,其特征在于 所述的主观感知失真测度D为
全文摘要
本发明提出了一种3D音频中水平方位参数的编码性能评价方法。本发明方法将水平方位参数及其JND值引入统计学失真测度中构建主观感知失真测度,利用所构建的主观感知失真测度进行3D音频中水平方位参数的编解码性能评价。本发明方法将水平方位参数的JND看作统计意义上人耳能忍受的水平方位偏差,引入统计学失真测度构建主观感知失真测度,从而进行编解码性能的评价指标。本发明方法能保证3D音频编码的评价结果与人耳主观感知更加一致,使3D音频编解码效果更符合人耳主观感知特性,从而提高编解码技术的主观性能。
文档编号G10L25/27GK102867518SQ20121033350
公开日2013年1月9日 申请日期2012年9月10日 优先权日2012年9月10日
发明者胡瑞敏, 王晓晨, 刘梦颖, 王樱, 杨姗姗, 王汪, 涂卫平, 杨玉红, 王松 申请人:武汉大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1