三维音频精简方法及系统的制作方法

文档序号:9399742阅读:533来源:国知局
三维音频精简方法及系统的制作方法
【技术领域】
[0001] 本发明属于声学设备领域,尤其涉及一种基于双耳声压低失真的三维多声道音频 系统扬声器精简技术方案。
【背景技术】
[0002] 随着3D电影的稳步发展,3D电视的发展也较为迅速。根据英国未来咨询公司研究 报告,适用于家庭中的3D电视销量预计将于2017年增加到1. 577亿台,约占全球售出电视 总量的58%。由此可见,3D影视视听体验不仅走入了影院,更是逐渐走入了千家万户。对 于现在的多媒体行业来说,"3D"已成为新的标志,3D音视频技术能带来更好的沉浸视听享 受,已成为多媒体领域的研究热点。然而,当前家庭影院系统仍以3D电视+立体声/5. 1声 道音响为主,难以重建声音的高度感和距离感。3D音频能够实现声源水平、高度和距离的精 确重现,已成为未来3D视听系统中音频系统的发展趋势,是当前多媒体领域的重要研究方 向。
[0003] 三维多声道音频技术听音区域范围较大,适用范围较广,全球先进的国家科研单 位机构和主要的多媒体标准化组织纷纷开展三维多声道音频的相关研究工作。牛津大学数 学研究院于1973年提出了 Ambisonics技术,从数学方面分析声场,对声场谐波进行分解和 重构,但随着谐波分解的阶数的增加,声场准确重构的同时需要的扬声器数目可达上千个。 荷兰代尔夫特理工大学在1993年给出了波场合成技术(Wave Field Synthesis, WFS),声音 录制和重放时无需数据处理,减小了复杂度,但理想的WFS重建需要扬声器摆放间隔较小, 扬声器数目也需多达几百个。2009年,杜比公司(Dolby)推出了带有高置声道的ProLogic IIz多声道三维音频回放系统 [2],以及后续的杜比全景声系统,利用64个扬声器,将原始二 维空间音效增加到三维,使声音更有空间包围感。2008年日本广播协会(NHK)科学技术研 究实验室研发出了 22. 2多声道音频系统,结构简单,并能兼容5. 1环绕立体声[3]。动态图 像专家组(Moving Pictures Experts Group,MPEG)于2011年启动了 3D音频技术标准的 制订和提案征集工作,在保证编码效率的情况下期望可以通过较少数目的扬声器重建声音 的三维空间信息,使3D音频技术能够应用到普通家庭。2012年,我国的国家自然科学基金 委员会专门发布了"三维音频基础理论和关键技术研究"重点研究项目指南,重点支持3D 音频技术的研究。
[0004] 但是目前现有的三维多声道音频系统所需扬声器数目较多,往往达到数十甚至上 千个,难以应用于家庭环境。针对当前3D多声道系统扬声器数目过多的问题,2012年,MPEG 发布了新的3D音频需求(N12610),正式启动了 3D音频技术提案的征集工作,要求在NHK 22. 2系统基础上通过扬声器精简支持面向家庭电视直播等应用。其中,扬声器精简技术是 通过将原始扬声器数目较多的多声道系统中的声道信号重新分配到较少数目的扬声器上, 并同时保持原有的听音效果不变,精简过程通常包括扬声器排布和声音信号分配两部分。 为能将三维音频系统更方便地适应于家庭应用环境,需要设计一种方法既能精简原多声道 系统扬声器组,又能保证重建声场与原声场误差最小。

【发明内容】

[0005] 本发明针对现有技术的不足,提供一种基于双耳声压低失真的三维多声道音频系 统扬声器精简技术方案,用于将原始三维多声道音频系统中L个扬声器精简为M个扬声器, 以获得精简后的M声道系统中扬声器组最优空间位置信息。
[0006] 本发明提供一种三维音频精简方法,包括以下步骤:
[0007] 步骤1,设原始三维多声道音频系统有L个扬声器,分别采集原始三维多声道音频 系统中L个扬声器的空间位置信息,初始化待精简扬声器集合为包括原始三维多声道音频 系统中L个扬声器;空间位置信息采集实现方式如下,
[0008] 设L个扬声器排布在与听音区域中心点〇之间距离为P的球面上,以听音区域中 心点〇为顶点构造三维空间直角坐标系XYZ,扬声器在平面XOY上的投影与X轴所成的角度 记为θ,扬声器与Z轴的夹角记为则扬声器的空间位置(炉)简化标记为(久炉);
[0009] 步骤2,采集人头特征的空间位置信息,实现方式如下,
[0010] 设人头被看作是半径为R的标准球,人头中心位于坐标原点处,人的两耳关于 YOZ平面对称;则人的左耳所在的位置Left = (R,0, 0),人的右耳所在的位置为Right = (R,π,〇),人头中心所在的位置为〇 = (〇, 〇, 〇);
[0011] 步骤3,将L个扬声器I1,…,L的输入时域信号\(0,·.·,?)经傅里叶变换得到 对应的频域信号((;
[0012] 步骤4,计算原始三维多声道音频系统的L个扬声器I1,…,L所播放的声音信号 在左耳处产生的声压和P (Left)、在右耳处产生的声压和P (Right),以及在人头中心〇处的 声压和P(O);
[0013] 步骤5,从当前的待精简扬声器集合中,寻找一个使原始声场失真最小的扬声器将 其精简剔除,包括以下子步骤,
[0014] 步骤5. 1,从当前的待精简扬声器集合的L个扬声器中选取一个扬声器,将其预删 除,得到剩余的(L-I)通道系统,剩余的(L-I)个扬声器用乙…,表示;
[0015] 步骤5. 2,计算预删除扬声器1;后,剩余(L-I)个扬声器所发出的声音在左、右耳 处的声压 P7(Left)与['.(Right);
[0016] 步骤5. 3,计算预删除扬声器1;后,剩余(L-I)个扬声器1_..工_:1所发出的声音在 双耳处的声压与原L个扬声器所发出声音在双耳处声压的失真值ε p并将失真值保存到失 真数组ERROR中,
[0017] 步骤5. 4,预删除扬声器的选择条件判断,实现如下,
[0018] 将预删除的扬声器编号J的值加1,即J = J+1 ;判断J>L是否成立,若判断条件不 成立,则返回步骤5. 1 ;若判断条件成立,则结束循环操作,执行步骤5. 5 ;
[0019] 步骤5. 5,精简剔除声场失真最小的扬声器,实现如下,
[0020] 从失真数组ERROR中找到最小的双耳处声压失真值ε_= ε ,,其中£]表示删除 扬声器Ij后双耳声压失真值,将扬声器I j真正执行剔除操作;剩余(L-I)个扬声器f,..., 频域信号分别记为%;
[0021] 步骤5. 6,精简剔除扬声器1,后,将剩余(L-I)个扬声器?,…,^1的频域信号 &(?),...,Jo)值赋给'(?,...,5^0),保留剩余(L-I)个扬声器I...,1 :1的空间位 置信息和频域信号A (?)、· . (?) ;然后将L个扬声器数目减1,得到新的L个待精简的扬 声器所构成的待精简扬声器集合I1,…,Iy进入步骤6 ;
[0022] 步骤6,进行精简迭代条件判断如下,
[0023] 判断当前待精简扬声器数L是否大于M,若是则返回步骤5,对新的当前待精简扬 声器集合继续进行精简,否则结束迭代,取出当前剩余的扬声器空间位置信息,得到M通道 系统的扬声器最优空间位置排布;
[0024] 步骤7,将M通道系统的对应扬声器上的频域信号经过傅立叶逆变换转换为时域 信号。
[0025] 而且,步骤4实现方式如下,
[0026] 设第J个扬声器1:播放的声音频率为f,则声音传播的波数为 c为声 速;扬声器播放的声音在任意听音点X处产生的声压为1力·
.,_其 中II1-XI为扬声器1;到听音点X的距离,Sv(i9)为扬声器的频域信号,G为比例因子;
[0027] 将声音信号划分为α个频带,设α个频带的中心频率为A、…、fa,对应的波数 分别为
[0028] 扬声器I1,…,L所播放的声音信号在左耳、右耳和人头中心处产生的声压的和 P (Left)、P (Right)与 P (〇)分别为
[0029]
[0030]
[0031]
[0032] 其中,Ic1表示第I个临界频带的中心频率对应的波数,I = 1、…、a。
[0033] 而且,步骤5. 1包括以下子步骤,
[0034] 步骤5. 1. 1,根据扬声器I…,^1和相应空间位置,计算当扬声器I1预删除后, 剩余(L-I)个扬声器1·.·,上所分配到的权值矩阵a ;= [a ;⑴... a;ai)]T如下,
[0035] 首先,已知(L-I)个扬声器[,…,石^所摆放的空间位置砍見)、…、以 及扬声器1 ;所摆放的空间位置術),根据以下公式计算参数Γ和b, CN 105120406 A 说明书 4/14 页
[0036]

[0037] 其中,
[0038] 中间参数 ifV|表示不超过该数的最大的整数;
[0039] IT(X)为连带勒让德多项式如下,
[0040]
[0041] 变量 n、m 满足 η = 1,· · ·,N,-n < m < η ;
[0042] 然后,当预删除扬声器1;后,剩余(L-I)个扬声器I...,ζ 所分配到的权值矩阵 a】= [a】⑴…a】(L1)]T根据公式a】=Γ 1I3计算得到;
[0043] 步骤5. 1. 2,当扬声器被预删除后,剩余(L-I)个扬声器?,...,IL1的频域信号按 照以下公式计算得到
[0044]
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1