一种面向对象音频编解码方法及系统的制作方法

文档序号:2822541阅读:161来源:国知局
专利名称:一种面向对象音频编解码方法及系统的制作方法
技术领域
本发明涉及音频编解码技术领域,尤其涉及一种面向对象音频编解码方法及系统。
背景技术
在声学领域中,"鸡尾酒效应"是指人耳有自动过滤噪声的机制,会把关注重点放在感 兴趣声音上。针对这种情况,面向对象音频编码方法根据音频信号的内容,将其中的对象 (关注音源)分离出来分别进行编码,并允许在不同的对象之间灵活分配码率,对重要的 对象(感兴趣声音)分配较多的比特,对次要的对象(非感兴趣声音)分配较少的比特, 在保持高压縮比的同时,提供更好的主观音频编码质量。
现有MPEG4音频编码工具集虽然对面向对象音频编码方法给出了抽象描述,然而却 缺乏具体的框架与细节定义。

发明内容
本发明的目的是提供一种面向对象音频编解码方法及系统,以分离音频信号中各音源 信号,经关注音源判别、关注度排序后作分级编解码。
为达到上述目的,本发明采用如下的技术方案 一种面向对象音频编码方法,包括以下步骤 □输入音频信号;
□对所述音频信号进行音源分离,获得各分离音源信号; □对所述各分离音源信号进行关注音源判别,获得关注音源信号; □对所述关注音源信号进行关注度排序,获得关注音源重要度排序; □根据所述关注音源重要度排序对关注音源信号进行可分级编码,获得音频编码码 流。
一种面向对象音频解码方法,包括以下步骤-□输入编码码流;
□根据关注音源重要度排序对所述编码码流进行可分级解码,获得关注音源信号。 一种面向对象音频编解码系统,包括
音源分离模块接收输入的音频信号,用于对所述输入音频信号进行音源分离,获得各 分离音源信号,并将各分离音源信号输出给关注音源判别模块;关注音源判别模块接收音源分离模块输出的各分离音源信号,用于对所述各分离音源 信号进行关注音源判别,获得关注音源信号,并将关注音源信号输出给关注音源重要度排 序模块;
关注音源重要度排序模块接收关注音源判别模块输入的关注音源信号,用于对所述关 注音源信号进行关注音源重要度排序,并将所获得的关注音源重要度排序信息输出给可分 级编码模块;
可分级编码模块接收关注音源重要度排序模块输入的关注音源重要度排序信息,用于 对所述音源信号进行可分级编码,获得编码码流;
可分级解码模块接收可分级编码模块输出的编码码流,用于根据关注音源重要度排序 信息从编码码流中解码获得各关注音源信号。
本发明具有以下优点和积极效果
1) 提供了基于关注音源判别、关注度排序的音频编解码方法;
2) 有效地实现对感兴趣声音的面向对象的编解码方法和系统。


图1是本发明提供的面向对象音频编码流程图。
图2是本发明提供的面向对象音频解码流程图。
图3是本发明提供的面向对象音频编解码系统结构图。
其中,
Sl—输入音频信号,S2—音源分离,S3—关注音源判别,S4—关注音源重要度排序, S5—可分级编码,S6—获得编码码流;S21—输入编码码流,S22—可分级解码,S23—获 得关注音源;l一音源分离模块,2—关注音源判别模块,3—关注音源重要度排序模块,4 一可分级编码模块,5—可分级解码模块。
具体实施例方式
下面以具体实施例结合附图对本发明作进一步说明-
本发明提供的面向对象音频编码方法,具体采用如下技术方案,参见图1,包括以下
步骤
Sl:输入音频信号;
S2:对所述音频信号进行音源分离,获得各分离音源信号;
S3-对所述各分离音源信号进行关注音源判别,获得关注音源信号;
S4:对所述关注音源信号进行关注度排序,获得关注音源重要度排序;S5-根据所述关注音源重要度排序对关注音源信号进行可分级编码,获得音频编码码流。
下面以具体实施例,详细描述本发明提供的面向对象音频编码方法。
步骤S1,具体实施时,可以使用各种音频分离方法,例如时域分离方法、频域分离方
法、时频域分离方法等,将输入音频时域信号SpS2,…Sm (其中,m为音频信号长度)分
离为各音源信号S;,S;,…SL,Sf,S〗,'.《,…S〖,S〗,…S:(其中,n为分离音源数目); 步骤S2,具体实施时,通过建立关注音源特征库的方式来对步骤Sl所得各分离音源
信号进行识别,得到各关注音源s;,s〖,…s^sf,s〗,…s^,…shs5,…s^
步骤S3,具体实施时,可采用基于能量的重要度排序原则对步骤S2所得各关注音源
s|,s!,'"s;n,sf,s^''s2m,...s;t^,''《^s")进行重要度排序,得到关注音源重要度
排序结果,同时将关注音源重要度排序信息送入编码码流;
步骤S4,具体实施时,依据步骤S3所得的关注音源重要度排序对关注音源进行编码, 可采用任何编码算法,在限定码率下对重要度高的关注音源优先编码并送入编码码流。
以上过程所得编码码流就是本发明所提供的面向对象音频编码的处理对象,解码过程 与编码过程相逆。
本发明提供的面向对象音频解码方法,具体采用如下技术方案,参见图2,包括以下 步骤
步骤S21:输入编码码流;
步骤S22:根据关注音源重要度排序对所述编码码流进行可分级解码; 步骤S23:获得关注音源信号。
下面以具体实施例,详细描述本发明提供的面向对象音频解码方法。
具体实施时,根据关注音源重要度排序信息从编码码流中解码,可采用任何与编码算
法对应的解码算法,得到各关注音源信号s!,si,…s^,sf,s〖,…s^,…si,si2,…sL (/")。
本发明提供的面向对象音频编解码系统,具体采用如下技术方案,参见附图3,包括 音源分离模块l、关注音源判别模块2、关注音源重要度排序模块3、可分级编码模块 4、可分级解码模块5,其中音源分离模块1接收输入的音频信号,用于对所述输入音频信 号进行音源分离,获得各分离音源信号,并将各分离音源信号输出给关注音源判别模块2; 关注音源判别模块2接收音源分离模块1输出的各分离音源信号,用于对所述各分离音源
5信号进行关注音源判别,获得关注音源信号,并将关注音源信号输出给关注音源重要度排 序模块3;关注音源重要度排序模块3接收关注音源判别模块2输入的关注音源信号,用 于对所述关注音源信号进行关注音源重要度排序,并将所获得的关注音源重要度排序信息
输出给可分级编码模块4;可分级编码模块4接收关注音源重要度排序模块3输入的关注 音源重要度排序信息,用于对所述音源信号进行可分级编码,获得编码码流;可分级解码 模块5接收可分级编码模块4输出的编码码流,用于根据关注音源重要度排序信息从编码 码流中解码获得各关注音源信号。
下面以具体实施例,详细描述本发明提供的面向对象音频编解码系统
音源分离模块1具体实施时,可以使用各种音频分离方法,例如时域分离方法、频域
分离方法、时频域分离方法等,将输入音频时域信号Si,S2,…Sm (其中,m为音频信号长
度)分离为各音源信号s!,s^…sL,sf,s22,…s:,…s ,s〗,…s:(其中,n为分离音源数
巨);
关注音源判别模块2具体实施时,通过建立关注音源特征库的方式来对所得各分离音 源信号进行识别,得到各关注音源S;,S!,…SL,Sf,S〗,…SL…Sf,S;,…S^
关注音源重要度排序模块3具体实施时,可采用基于能量的重要度排序原则对所得各
关注音源s;,s;,…sL,sf,s22,…s:,…sf,s^,…s: (B")进行重要度排序,得到关注音
源重要度排序结果,同时将关注音源重要度排序信息送入编码码流;
可分级编码模块4具体实施时,依据关注音源重要度排序模块3所得的关注音源重要 度排序对关注音源进行编码,可采用任何编码算法,在限定码率下对重要度高的关注音源 优先编码并送入编码码流;
可分级解码模块5具体实施时,根据关注音源重要度排序信息从编码码流中解码,可 采用任何与编码算法对应的解码算法,得到各关注音源信号
S〗,S;,…SL,Sf,S"…S,…S;,S;,.义(/j)。
权利要求
1.一种面向对象音频编码方法,其特征在于,包括以下步骤①输入音频信号;②对所述音频信号进行音源分离,获得各分离音源信号;③对所述各分离音源信号进行关注音源判别,获得关注音源信号;④对所述关注音源信号进行关注度排序,获得关注音源重要度排序;⑤根据所述关注音源重要度排序对关注音源信号进行可分级编码,获得音频编码码流。
2. —种面向对象音频解码方法,其特征在于,包括以下步骤① 输入编码码流;② 根据关注音源重要度排序对所述编码码流进行可分级解码,获得关注音源信号。
3. —种面向对象音频编解码系统,其特征在于,包括音源分离模块(1)接收输入的音频信号,用于对所述输入音频信号进行音源分离,获得各分离音源信号,并将各分离音源信号输出给关注音源判别模块(2);关注音源判别模块(2)接收音源分离模块(1)输出的各分离音源信号,用于对所述各分离音源信号进行关注音源判别,获得关注音源信号,并将关注音源信号输出给关注音源重要度排序模块(3);关注音源重要度排序模块(3)接收关注音源判别模块(2)输入的关注音源信号,用于对所述关注音源信号进行关注音源重要度排序,并将所获得的关注音源重要度排序信息输出给可分级编码模块(4);可分级编码模块(4)接收关注音源重要度排序模块(3)输入的关注音、源重要度排序 信息,用于对所述音源信号进行可分级编码,获得编码码流;可分级解码模块(5)接收可分级编码模块(4)输出的编码码流,用于根据关注音源 重要度排序信息从编码码流中解码获得各关注音源信号。
全文摘要
本发明涉及音频编解码技术领域,尤其涉及一种面向对象音频编解码方法及系统。本发明方法包括以下步骤,即输入音频信号、对所述音频信号进行音源分离,获得各分离音源信号、对所述各分离音源信号进行关注音源判别,获得关注音源信号、对所述关注音源信号进行关注度排序,获得关注音源重要度排序、根据所述关注音源重要度排序对关注音源信号进行可分级编码,获得音频编码码流,本发明系统包括音源分离模块、关注音源判别模块、关注音源重要度排序模块、可分级编码模块、可分级解码模块。本发明以分离音频信号中各音源信号,经关注音源判别、关注度排序后作分级编解码。
文档编号G10L19/00GK101650947SQ20091027211
公开日2010年2月17日 申请日期2009年9月17日 优先权日2009年9月17日
发明者成 周, 波 杭, 王晓晨, 胡瑞敏, 丽 高 申请人:武汉大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1