用于降低空间参数误码率的三维音频编码方法及装置的制造方法

文档序号:9261970阅读:489来源:国知局
用于降低空间参数误码率的三维音频编码方法及装置的制造方法
【技术领域】
[0001] 本发明设及数字音频领域,针对提高重建=维音频空间感知质量的需求,尤其设 及一种基于不等差错保护来降低=维音频空间参数误码率的编码技术方案。
【背景技术】
[000引 2009年底,立维电影《阿凡达》在全球立十多个国家登上票房榜首,到2010年9月 初,全球累计票房超过27亿美元。《阿凡达》之所W能取得如此辉煌的票房成绩,在于它所 采用的全新的=维特效制作技术带给人们感官上的震撼效果。要想达到更好的视听体验, 还需要有与S维视频内容同步的S维声场听觉效果,才能真正达到身临其境的视听感受。
[0003] 3D音频通常的输出码流结构包括两部分:下混单声道信号部分和3D空间参数部 分。而随着越来越高的3D空间分辨率W及越来越多的声道或对象数量,编码声道和空间参 数的比特率会线性地急剧地增加,该就要求更大的带宽来传输3D音频。
[0004] 因此,当带宽有限且聚焦于3D音频的空间感知质量时,3D码流中的空间参数部分 就具有相对而言更高的重要性,需要更多的保护。

【发明内容】

[0005] 本发明的目的在于针对带宽有限且需要保证3D音频的空间感知质量的现状,提 供一种用于降低3D音频空间参数误码率的UEP编码方案。
[0006] 本发明的技术方案提供一种用于降低空间参数误码率的=维音频编码方法,编码 过程包括W下步骤,
[0007] 步骤C1,设输入为经信源编码器编码所得大小为nbits的3D音频码流,将该3D 音频码流的3D空间参数部分作为MIB部分,其大小为ainbits,a1为系数,0 <a1< 1 ; 为MIB部分添加窗Wi,窗Wi只包含MIB部分相应的3D空间参数比特集合S1;所述MIB部分 为更重要比特部分;
[000引步骤C2,将3D音频码流的下混单声道信号部分作为LIB部分,并添加窗W2,窗胖2 包含MIB部分相应的3D空间参数比特集合Si和LIB部分相应的下混单声道信号比特集合 S2;所述LIB部分为次重要比特部分;
[0009] 步骤C3,选择窗Wi和窗W之一,包括根据选择概率Ti来选择窗W。i= 1,2,其 中,Tl是窗Wi相应的选择概率,T2是窗W2相应的选择概率,T 2= 1-T 1,〇《1 ;
[0010] 步骤C4,随机产生一个度数d,包括根据步骤C3所选窗Wi相应的度分布函数 Qi(x)选择一个度数d;
[0011] 步骤巧,从步骤C3所选窗Wi中随机选取d个符号并进行模为2的异或运算,得到 一个编码符号;
[0012] 步骤C6,返回步骤C3生成新的编码符号,直至得到m个编码符号,输出大小为m bits的编码码流;其中,m= 丫n,丫为预设的解码开销。
[0013] 而且,度分布函数Qi(x),i= 1,2采用同一个度分布函数如下,
[0014] Q(X)= 0. 007969X+0. 493570x2+0. 166220x3
[0015] +0. 072646x4+0. 082558x5+0. 056058x8+0. 037229x9
[0016] +0. 055590x19+0. 025023x64+0. 003135x66
[0017] 其中,X为随机变量。
[001引 而且,T 1= 0. 084, T 2= 0. 916。
[0019]而且,丫大于1. 07。
[0020] 而且,丫取值为1.2。
[0021] 本发明还相应提供一种用于降低空间参数误码率的=维音频编码装置,包括W下 模块,
[0022] 第一加窗模块,用于设输入为经信源编码器编码所得大小为nbits的3D音频码 流,将该3D音频码流的3D空间参数部分作为MIB部分,其大小为ainbits,a1为系数,0 <ai< 1 ;为MIB部分添加窗Wi,窗Wi只包含MIB部分相应的3D空间参数比特集合Si;所 述MIB部分为更重要比特部分;
[0023] 第二加窗模块,用于将3D音频码流的下混单声道信号部分作为LIB部分,并添加 窗胖2,窗W2包含MIB部分相应的3D空间参数比特集合S1和LIB部分相应的下混单声道信 号比特集合S,;所述LIB部分为次重要比特部分;
[0024] 窗选择模块,用于选择窗Wi和窗W2之一,包括根据选择概率Ti来选择窗Wi,i =1,2,其中,Ti是窗Wi相应的选择概率,T2是窗W2相应的选择概率,T2= 1-T1, 0《T 1 ;
[0025] 度数生成模块,用于随机产生一个度数d,包括根据窗选择模块所选窗Wi相应的度 分布函数Qi(x)选择一个度数d;
[0026] 编码符号生成模块,用于从窗选择模块所选窗Wi中随机选取d个符号并进行模为 2的异或运算,得到一个编码符号;
[0027] 输出模块,用于命令窗选择模块重新生成新的编码符号,直至得到m个编码符号, 输出大小为mbits的编码码流;其中,m= 丫n,丫为预设的解码开销。
[002引而且,度分布函数Qi(x),i= 1,2采用同一个度分布函数如下,
[0029] Q(X)= 0. 007969X+0. 493570x2+0. 166220x3
[0030] +0. 072646x4+0. 082558x5+0. 056058x8+0. 037229x9
[0031] +0. 055590x19+0. 025023x64+0. 003135x66 [003引其中,X为随机变量。
[0033]而且,T 1= 0. 084, T 2= 0. 916。
[0034] 而且,丫大于 1.07。
[0035] 而且,丫取值为1. 2。
[0036] 本发明通过对包含有下混单声道部分和3D空间参数部分的3D音频码流进行不等 差错保护来降低3D音频空间参数的误码率,提高重建S维音频的空间质量,令3D多声道空 间音频信号经过信源编码器后得到的3D音频码流输入到基于不等差错保护的编码设计方 案所设计的编码器中,对码流的3D空间参数部分进行重点保护,对下混单声道信号部分进 行次重点保护,来实现对输入的3D音频码流的不等差错保护;由于3D空间参数是使得重建 =维音频具有空间感知质量的关键信息,而该样的不等差错保护方案能够很好地保护更关 键信息而又不会过多地损坏次关键信息。与传统方法的均等差错保护策略对比,使用不等 差错保护策略来传输3D音频码流可W在带宽有限的情况下使3D音频空间参数误码率降低 一个数量级。因此,本发明通过对3D音频码流进行不等差错保护,能够降低3D音频空间参 数误码率,提高重建=维音频的空间质量,得到更好的=维音频重放效果W及整体的视听 感受。
【附图说明】
[0037]图1是本发明实施例的编码方案流程图。
[003引图2是本发明实施例的加窗示意图。
【具体实施方式】
[0039]W下结合附图和实施例详细说明本发明技术方案。
[0040] 本发明提供一种降低3D音频空间参数误码率的肥P编码方案,即一种基于不等差 错保护来降低=维音频空间参数误码率,提高重建=维音频空间感知质量的编码方法,实 现将一种不等差错保护的编码方法应用于=维音频码流。本发明考虑到,因特网和移动网 络是典型的二进制可擦除信道炬EC)。传统的数据传输中,所有的数据在邸C上都是均等 差错保护巧EP)的,但在有些情况下对数据中一部分数据的可靠性要求很高,该部分数据 需要更多的保护,而其他数据的可靠性可W相对差一些,需要的保护就相对少些,因此提出 在音频传输领域使用不等差错保护扣邸)策略。本发明进一步针对音频传输的数据特征进 行U邸策略具体实现设计,所提供编码方案的输入是经过信源编码器编码的3D音频码流, 包括下混单声道信号部分和3D空间参数部分。
[0041] 具体实施时可采用计算机软件技术实现自动运行流程。参见图1,本发明实施例实 现信道编码器的功能,执行W下流程:
[0042] 步骤C1,经过信源编码器编码的大小为nbits的3D音频码流作为输入,其中,该 码流的3D空间参数部分被视为更重要比特(MIB)部分,其大小为ain(0 <a1<l)bits, 并为其添加窗Wi,该窗只包含MIB部分相应的3D空间参数比特集合Si。
[00创具体实施时,根据已知的MIB部分大小和n的比值可m十算出a1的具体取值。
[0044] 步骤C2,将3D音频码流的下混单声道信号部分作为次重要比特(LIB)部分,其大 小为a2n(0 <a2< 1)bits也就是(1-a1)n,并添加窗胖2,该窗包含MIB部分相应的3D空 间参数比特集合Si和LIB部分相应的下混单声道信号比特集合S2。
[0045] 实施例中n= 96000, 〇1= 0. 2,则Si的大小为19200bits,而S2的大小为 768(K)bits,图2展示了本实施例的加窗示意图,其中S。i= 1,2,. . .,96000代表信息符号, S。i= 1,2, ...,19200 代表集合Si中的信息符号,S。i= 19201,19202, ...,96000 代表集 合S2中的信息符号。
[0046] 步骤C3,按照概率选择Wi和W2之一;根据选择概率T。i= 1,2来选择窗i= 1,2,其中,Ti是窗Wi相应的选择概率,T2是窗W2相应的选择概率,WT1(〇《 来选择窗Wi,WT2= 1-T1(0《T1)来选择窗W2。
[0047] 实施例中,肥P情况下T1= 0. 084,T2= 0. 916,而传统的均等差错保护巧邸)情 况下,T1=0,T2= 1。
[0048] 步骤C4,每生成一个编码符号前,都要随机产生一个度数d,根据步骤C3所选窗Wi 相应的度数分布〇i(x)来选择一个度d。其中,X是度分布函数〇i(x)的自变量,它是一个 随机变量。
[0049] 对于所有自变量X,度分布函数Q(X)是编码度数为X的概率,其表达式为:
[00加]
(1)
[0化1] 而此处该个随机变量X就是度数d,取值为1,2,…,n。
[0化2] 具体实施时,本领域技术人员可W自行设定具体的度分布函数Qi(x),i
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1