用于降低空间参数误码率的三维音频编码方法及装置的制造方法

文档序号：9261970阅读：489来源：国知局

用于降低空间参数误码率的三维音频编码方法及装置的制造方法
【技术领域】
[0001] 本发明设及数字音频领域，针对提高重建=维音频空间感知质量的需求，尤其设及一种基于不等差错保护来降低=维音频空间参数误码率的编码技术方案。
【背景技术】
[000引 2009年底，立维电影《阿凡达》在全球立十多个国家登上票房榜首，到2010年9月初，全球累计票房超过27亿美元。《阿凡达》之所W能取得如此辉煌的票房成绩，在于它所采用的全新的=维特效制作技术带给人们感官上的震撼效果。要想达到更好的视听体验，还需要有与S维视频内容同步的S维声场听觉效果，才能真正达到身临其境的视听感受。
[0003] 3D音频通常的输出码流结构包括两部分：下混单声道信号部分和3D空间参数部分。而随着越来越高的3D空间分辨率W及越来越多的声道或对象数量，编码声道和空间参数的比特率会线性地急剧地增加，该就要求更大的带宽来传输3D音频。
[0004] 因此，当带宽有限且聚焦于3D音频的空间感知质量时，3D码流中的空间参数部分就具有相对而言更高的重要性，需要更多的保护。

【发明内容】

[0005] 本发明的目的在于针对带宽有限且需要保证3D音频的空间感知质量的现状，提供一种用于降低3D音频空间参数误码率的UEP编码方案。
[0006] 本发明的技术方案提供一种用于降低空间参数误码率的=维音频编码方法，编码过程包括W下步骤，
[0007] 步骤C1，设输入为经信源编码器编码所得大小为nbits的3D音频码流，将该3D 音频码流的3D空间参数部分作为MIB部分，其大小为ainbits,a1为系数，0 <a1< 1 ; 为MIB部分添加窗Wi，窗Wi只包含MIB部分相应的3D空间参数比特集合S1;所述MIB部分为更重要比特部分；
[000引步骤C2,将3D音频码流的下混单声道信号部分作为LIB部分，并添加窗W2,窗胖2 包含MIB部分相应的3D空间参数比特集合Si和LIB部分相应的下混单声道信号比特集合 S2;所述LIB部分为次重要比特部分；
[0009] 步骤C3,选择窗Wi和窗W之一，包括根据选择概率Ti来选择窗W。i= 1，2,其中，Tl是窗Wi相应的选择概率，T2是窗W2相应的选择概率，T 2= 1-T 1，〇《1 ;
[0010] 步骤C4,随机产生一个度数d，包括根据步骤C3所选窗Wi相应的度分布函数 Qi(x)选择一个度数d;
[0011] 步骤巧，从步骤C3所选窗Wi中随机选取d个符号并进行模为2的异或运算，得到一个编码符号；
[0012] 步骤C6,返回步骤C3生成新的编码符号，直至得到m个编码符号，输出大小为m bits的编码码流；其中，m= 丫n，丫为预设的解码开销。
[0013] 而且，度分布函数Qi(x)，i= 1，2采用同一个度分布函数如下，
[0014] Q(X)= 0. 007969X+0. 493570x2+0. 166220x3
[0015] +0. 072646x4+0. 082558x5+0. 056058x8+0. 037229x9
[0016] +0. 055590x19+0. 025023x64+0. 003135x66
[0017] 其中，X为随机变量。
[001引而且，T 1= 0. 084, T 2= 0. 916。
[0019]而且，丫大于1. 07。
[0020] 而且，丫取值为1.2。
[0021] 本发明还相应提供一种用于降低空间参数误码率的=维音频编码装置，包括W下模块，
[0022] 第一加窗模块，用于设输入为经信源编码器编码所得大小为nbits的3D音频码流，将该3D音频码流的3D空间参数部分作为MIB部分，其大小为ainbits,a1为系数，0 <ai< 1 ;为MIB部分添加窗Wi，窗Wi只包含MIB部分相应的3D空间参数比特集合Si;所述MIB部分为更重要比特部分；
[0023] 第二加窗模块，用于将3D音频码流的下混单声道信号部分作为LIB部分，并添加窗胖2,窗W2包含MIB部分相应的3D空间参数比特集合S1和LIB部分相应的下混单声道信号比特集合S,;所述LIB部分为次重要比特部分；
[0024] 窗选择模块，用于选择窗Wi和窗W2之一，包括根据选择概率Ti来选择窗Wi，i =1，2,其中，Ti是窗Wi相应的选择概率，T2是窗W2相应的选择概率，T2= 1-T1， 0《T 1 ;
[0025] 度数生成模块，用于随机产生一个度数d，包括根据窗选择模块所选窗Wi相应的度分布函数Qi(x)选择一个度数d;
[0026] 编码符号生成模块，用于从窗选择模块所选窗Wi中随机选取d个符号并进行模为 2的异或运算，得到一个编码符号；
[0027] 输出模块，用于命令窗选择模块重新生成新的编码符号，直至得到m个编码符号，输出大小为mbits的编码码流；其中，m= 丫n，丫为预设的解码开销。
[002引而且，度分布函数Qi(x)，i= 1，2采用同一个度分布函数如下，
[0029] Q(X)= 0. 007969X+0. 493570x2+0. 166220x3
[0030] +0. 072646x4+0. 082558x5+0. 056058x8+0. 037229x9
[0031] +0. 055590x19+0. 025023x64+0. 003135x66 [003引其中，X为随机变量。
[0033]而且，T 1= 0. 084, T 2= 0. 916。
[0034] 而且，丫大于 1.07。
[0035] 而且，丫取值为1. 2。
[0036] 本发明通过对包含有下混单声道部分和3D空间参数部分的3D音频码流进行不等差错保护来降低3D音频空间参数的误码率，提高重建S维音频的空间质量，令3D多声道空间音频信号经过信源编码器后得到的3D音频码流输入到基于不等差错保护的编码设计方案所设计的编码器中，对码流的3D空间参数部分进行重点保护，对下混单声道信号部分进行次重点保护，来实现对输入的3D音频码流的不等差错保护；由于3D空间参数是使得重建 =维音频具有空间感知质量的关键信息，而该样的不等差错保护方案能够很好地保护更关键信息而又不会过多地损坏次关键信息。与传统方法的均等差错保护策略对比，使用不等差错保护策略来传输3D音频码流可W在带宽有限的情况下使3D音频空间参数误码率降低一个数量级。因此，本发明通过对3D音频码流进行不等差错保护，能够降低3D音频空间参数误码率，提高重建=维音频的空间质量，得到更好的=维音频重放效果W及整体的视听感受。
【附图说明】
[0037]图1是本发明实施例的编码方案流程图。
[003引图2是本发明实施例的加窗示意图。
【具体实施方式】
[0039]W下结合附图和实施例详细说明本发明技术方案。
[0040] 本发明提供一种降低3D音频空间参数误码率的肥P编码方案，即一种基于不等差错保护来降低=维音频空间参数误码率，提高重建=维音频空间感知质量的编码方法，实现将一种不等差错保护的编码方法应用于=维音频码流。本发明考虑到，因特网和移动网络是典型的二进制可擦除信道炬EC)。传统的数据传输中，所有的数据在邸C上都是均等差错保护巧EP)的，但在有些情况下对数据中一部分数据的可靠性要求很高，该部分数据需要更多的保护，而其他数据的可靠性可W相对差一些，需要的保护就相对少些，因此提出在音频传输领域使用不等差错保护扣邸）策略。本发明进一步针对音频传输的数据特征进行U邸策略具体实现设计，所提供编码方案的输入是经过信源编码器编码的3D音频码流，包括下混单声道信号部分和3D空间参数部分。
[0041] 具体实施时可采用计算机软件技术实现自动运行流程。参见图1，本发明实施例实现信道编码器的功能，执行W下流程：
[0042] 步骤C1，经过信源编码器编码的大小为nbits的3D音频码流作为输入，其中，该码流的3D空间参数部分被视为更重要比特（MIB)部分，其大小为ain(0 <a1<l)bits，并为其添加窗Wi，该窗只包含MIB部分相应的3D空间参数比特集合Si。
[00创具体实施时，根据已知的MIB部分大小和n的比值可m十算出a1的具体取值。
[0044] 步骤C2,将3D音频码流的下混单声道信号部分作为次重要比特（LIB)部分，其大小为a2n(0 <a2< 1)bits也就是（1-a1)n，并添加窗胖2,该窗包含MIB部分相应的3D空间参数比特集合Si和LIB部分相应的下混单声道信号比特集合S2。
[0045] 实施例中n= 96000, 〇1= 0. 2,则Si的大小为19200bits，而S2的大小为 768(K)bits，图2展示了本实施例的加窗示意图，其中S。i= 1，2,. . .，96000代表信息符号， S。i= 1，2, ...，19200 代表集合Si中的信息符号，S。i= 19201，19202, ...，96000 代表集合S2中的信息符号。
[0046] 步骤C3,按照概率选择Wi和W2之一；根据选择概率T。i= 1，2来选择窗i= 1，2,其中，Ti是窗Wi相应的选择概率，T2是窗W2相应的选择概率，WT1(〇《来选择窗Wi，WT2= 1-T1(0《T1)来选择窗W2。
[0047] 实施例中，肥P情况下T1= 0. 084,T2= 0. 916,而传统的均等差错保护巧邸）情况下，T1=0，T2= 1。
[0048] 步骤C4,每生成一个编码符号前，都要随机产生一个度数d，根据步骤C3所选窗Wi 相应的度数分布〇i(x)来选择一个度d。其中，X是度分布函数〇i(x)的自变量，它是一个随机变量。
[0049] 对于所有自变量X，度分布函数Q(X)是编码度数为X的概率，其表达式为：
[00加]
(1)
[0化1] 而此处该个随机变量X就是度数d，取值为1，2,…，n。
[0化2] 具体实施时，本领域技术人员可W自行设定具体的度分布函数Qi(x)，i

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡瑞敏;杨乘;苏柳月;王晓晨;涂卫平;高戈;姜林;武庭照;柯善发;
技术所有人：武汉大学;
我是此专利的发明人

上一篇：水印加载装置及水印加载的方法
上一篇：音频流中的丢帧补偿实现方法和装置的制造方法