频谱平滑化装置、编码装置、解码装置、通信终端装置、基站装置以及频谱平滑化方法

文档序号:2823175阅读:173来源:国知局
专利名称:频谱平滑化装置、编码装置、解码装置、通信终端装置、基站装置以及频谱平滑化方法
技术领域
本发明涉及将语音信号的频谱平滑化的频谱平滑化装置、编码装置、解码装置、通 信终端装置、基站装置以及频谱平滑化方法。
背景技术
通过以因特网通信为代表的分组通信系统、或移动通信系统等传输语音/音频信 号时,为了提高语音/音频信号的传输效率,常使用压缩/编码技术。另外,近年来,仅以低 比特率对语音/音频信号进行编码,另一方面,对更高画质的语音/音频信号进行编码的技 术的需求日益高涨。对于这样的需求,开发了用于下述目的的各种技术,S卩,对语音信号进行正交变换 (时间-频率变换),计算语音信号的频率分量(频谱),对计算出的频谱进行线性变换及非 线性变换等处理而提高解码信号的质量(例如,参照专利文献1)。在专利文献1公开的方 法中,首先从一定时间长度的语音信号分析该语音信号所包含的频谱,并且对于分析得出 的频谱,进行其频谱强度的值越大越增强非线性变换处理。接着,对于进行了非线性变换处 理的频谱,在频域上进行线性的平滑化处理。其后,进行用于消除非线性变换特性的反非线 性变换处理,还进行用于消除平滑化特性的反平滑化处理,由此抑制语音信号所包含的全 频带的噪音分量。这样,在专利文献1公开的方法中,通过在对于从语音信号获得的频谱的 全部样本进行了非线性变换处理之后,进行频谱的平滑化,由此获得良好音质的语音信号。 另外,专利文献1中列举了乘幂、对数变换等变换方法作为非线性处理的例子。现有技术文献专利文献专利文献1 特开2002-244695号公报专利文献2 国际公开第2007/037361号小册子非专利文献非专利文献1 =Yuichiro TAKAMIZAWA, Toshiyuki NOMURA and Masao IKEKAWA, "High-Quality and Processor-Efficient Implementation of and MPEG-2 AAC Encoder”,IEICE TRANS. INF. &SYST.,VOL. E86-D,No.3MARCH 200
发明内容
发明需要解决的问题但是,专利文献1公开的方法中存在下述问题,即,对从语音信号获得的频谱的全 部样本进行非线性变换处理,所以处理运算量庞大。为了削减处理运算量,单纯地从频谱的 样本中提取一部分的样本,并仅对于提取出的样本进行非线性变换处理,即使在非线性变 换后进行频谱的平滑化,也不一定能够获得足够好的语音质量。本发明的目的在于,提供在对于从语音信号计算出的频谱进行了非线性变换之后,进行平滑化的结构中,能够维持良好的语音质量,而且大幅度削减处理运算量的频谱平 滑化装置、编码装置、解码装置、通信终端装置、基站装置以及频谱平滑化方法。解决问题的方案本发明的频谱平滑化装置采用的结构包括时间-频率变换单元,将输入的信号 进行时间-频率变换而生成频率分量;子带分割单元,将所述频率分量分割为多个子带;代 表值计算单元,对于所述分割出的各个子带,使用算术平均的计算及利用了该计算结果的 乘法运算计算子带的代表值;非线性变换单元,对于每个所述子带的代表值进行非线性变 换;以及平滑化单元,将所述进行了非线性变换的代表值在频域上进行平滑。本发明的频谱平滑化方法包括时间-频率变换步骤,将输入的信号进行时间-频 率变换而生成频率分量;子带分割步骤,将所述频率分量分割为多个子带;代表值计算步 骤,对于所述分割出的各个子带,使用算术平均的计算及利用了该计算结果的乘法运算计 算子带的代表值;非线性变换步骤,将每个所述子带的代表值进行非线性变换;以及平滑 化步骤,将进行了所述非线性变换的代表值在频域上进行平滑。发明的效果根据本发明,能够维持良好的语音质量,而且大幅度削减处理运算量。


图IA 图ID是表示本发明实施方式1的处理的概要的频谱概略图。图2是表示实施方式1的频谱平滑化装置的主要结构的方框图。图3是表示实施方式1的代表值计算单元的主要结构的方框图。图4是表示实施方式1的输入信号的子带及子群的结构的概略图。图5是表示本发明实施方式2的具有编码装置和解码装置的通信系统的结构的方 框图。图6是表示实施方式2的图5所示的编码装置的内部主要结构的方框图。图7是表示实施方式2的图6所示的第2层编码单元的内部主要结构的方框图。图8是表示实施方式2的图7所示的频谱平滑单元的主要结构的方框图。图9是用于说明实施方式2的图7所示的滤波单元中的滤波处理的细节的图。图10是表示在实施方式2的图7所示的搜索单元中对子带搜索最合适音调 系数Tp’的处理的步骤的流程图。图11是表示实施方式2的图5所示的解码装置的内部主要结构的方框图。图12是表示实施方式2的图11所示的第2层解码单元的内部主要结构的方框图。标号说明100频谱平滑化装置101,315,334,357 时间-频率变换处理单元102子带分割单元103代表值计算单元104非线性变换单元105 平滑化单元106反非线性变换单元
201 相加平均计算单元202 相乘平均计算单元301编码装置302传输路径303解码装置311下采样处理单元312第1层编码单元313,332 第一层解码单元314,333 上采样处理单元316第二层编码单元317编码信息汇集单元318 延迟单元331编码信息分离单元335第2层解码单元351 分离单元352、361 频谱平滑化单元353、362 滤波器状态设定单元354,363 滤波单元355增益解码单元356频谱调整单元360频带分割单元364搜索单元365音调系数设定单元366增益编码单元367 复用单元
具体实施例方式以下,参照附图详细说明本发明的实施方式。(实施方式1)首先使用图1说明本发明实施方式的频谱平滑化方法的概要。图1是用于说明本 实施方式的频谱平滑化方法的概要的频谱图。图IA表示输入信号的频谱。在本实施方式中,首先将输入信号的频谱分割为多个 子带。图IB表示已分割为多个子带的输入信号的频谱的情形。另外,图1的频谱图是用于 说明本发明的概要的图,例如,本发明并不限定图中的子带数。接着,对各个子带计算代表值。具体而言,将子带内的样本进一步分割为多个子 群。另外,对每个子群计算频谱的绝对值的算术平均(相加平均)。接着,对每个子带计算各个子群的算术平均值的几何平均(相乘平均)。另外,上 述的几何平均值此时还不是正确的几何平均值,计算将各个子群的算术平均值单纯地相乘 所得的值,在后述的非线性变换之后求得正确的几何平均值。上述处理是为了进一步削减运算量,当然也可以在此时求取正确的几何平均值。将上述的几何平均值设为各个子带的代表值。图IC中,与以虚线表示的输入信号 的频谱重叠而表示各个子带的代表值。另外,为了使说明易于理解,图IC将正确的几何平 均值表示为代表值,替代将各个子群的算术平均值单纯地相乘所得的值。接着,对于各个子带的代表值,在相对于输入信号的频谱,进行频谱强度的值越大 越增强非线性变换(例如,对数变换)之后,在频域进行平滑化处理。此后,进行反非线性 变换(例如,对数逆变换),对各个子带计算平滑化频谱。图ID中,与以虚线表示的输入信 号的频谱重叠而表示各个子带的平滑化频谱。通过这样的处理,对数区域内的频谱的平滑化能够抑制语音质量的劣化,而且大 幅度削减处理运算量。以下,说明获得该效果的本发明的实施方式的频谱平滑化装置的结 构。本实施方式的频谱平滑化装置将输入频谱平滑化,并输出平滑化后的频谱(以下 称为“平滑化频谱”)作为输出信号。更具体而言,频谱平滑化装置将输入信号每N样本(N 为自然数)为单位进行划分,将N样本作为1帧而对每帧进行平滑化处理。这里,将作为平
滑化处理的对象的输入信号表示为= 0.....Ν-1)。ι表示每N样本为单位划分的输
入信号中第n+1样本。图2表示本实施方式的频谱平滑化装置100的主要结构。图2所示的频谱平滑化装置100主要包括时间-频率变换处理单元101、子带分 割单元102、代表值计算单元103、非线性变换单元104、平滑化单元105以及反非线性变换 单元106。时间-频率变换处理单元101对输入信号ι进行快速傅立叶变换(FFT =Fast Fourier Transform),计算频率分量的频谱Sl (k)(以下称为输入频谱)。另外,时间-频率变换处理单元101将输入频谱Sl (k)输出到子带分割单元102。子带分割单元102将从时间-频率变换处理单元101输入的输入频谱Sl (k)分割 为P(P为2以上的整数)个子带。以下,以下述情况为例进行说明,即,子带分割单元102 将输入频谱Sl (k)分割,使各个子带的样本数相等。另外,各个子带的样本数也可以是在各 个子带不同。子带分割单元102将已分割为子带的频谱(以下也称为“子带频谱”)输出到 代表值计算单元103。代表值计算单元103对于从子带分割单元102输入的、已分割为子带的输入频谱 的各个子带,计算代表值,将并计算出每个子带的代表值输出到非线性变换单元104。在后 面叙述代表值计算单元103的详细处理。图3表示代表值计算单元103的内部结构。图3表示的代表值计算单元103包括 相加平均计算单元201以及相乘平均计算单元202。首先,从子带分割单元102,子带频谱被输入到相加平均计算单元201。相加平均计算单元201将输入的子带频谱的各个子带进一步分割为Q个⑴为2 以上的整数)的子群(第0子群 第Q-I子群)。另外,以下,以Q个的各个子群分别由R 个(R为2以上的整数)的样本构成情况为例进行说明。另外,这里说明Q个的各个子群都 由R个样本构成的情况,但各个子群内的样本当然也可以为不同的数。图4表示子带和子群的结构例。图4表示作为一例,构成1子带的样本数为8,构成子带的子群数Q为2,子群内的样本数R为4的情况。接着,相加平均计算单元201对Q个子群的各个子群,使用式(1),计算各个子群所 包含的频谱(FFT系数)的绝对值的算术平均(相加平均)。
1 R—1AVElq = S\ (q = 0,…Q-1) ... (1)
K 1=0另外,在式⑴中,AVEltl是第q子群所包含的频谱(FFT系数)的绝对值的算术平 均(相加平均),B&表示第q子群的开头样本的索引。接着,相加平均计算单元201将计算出的每个子带的算术平均(相加平均)值频 谱AVElq(q = 0 Q-1)(子带算术平均值频谱)输出到相乘平均计算单元202。相乘平均计算单元202将从相加平均计算单元201输入的每个子带的算术平均值 (相加平均)频谱AVElq(q = 0 Q-1),如式( 所示那样全部相乘,对每个子带计算代表
值频谱(子带代表值频谱)AVE\(p = 0 P-1)。
e-1Aveip=WAVEIi (p = 0,…ρ-ι) · · ·⑵
i=0式ο)中,Ρ是子带数。接着,相乘平均计算单元202将计算出的子带代表值频谱AVE\ (P = 0 P_l)输 出到非线性变换单元104。非线性变换单元104对于从相乘平均计算单元202输入的子带代表值频谱 AVE2p(p = 0 P-1),使用式(3),对于各个代表值,进行其值越大越增强特性的非线性变 换,计算第1子带对数代表值频谱AVE;3p(p = 0 P-1)。这里,说明进行对数变换作为非线 性变换处理的情况。AVE3p = Iog10 (AVE2p) (ρ = 0,…P_l) ... (3)接着,非线性变换单元104使用式,通过对于计算出的第1子带对数代表值频 谱AVE!3p(p = 0 P-1)乘以子群数Q的倒数,计算第2子带对数代表值频谱AVE4P (ρ = 0 P-D。
AVE3PAVEAp = ^ ^ (ρ = ο, ...ρ-ι) …⑷相乘平均计算单元202中的式O)的处理中,仅单纯地使各个子带的子带算术平 均值频谱AVEl1^H乘,但通过非线性变换单元104中的式(4)的处理而计算几何平均(相乘 平均)。这样,在本实施方式中,使用式C3)变换为对数区域之后,使用式(4)乘以子群数Q 的倒数。由此,能够将运算量大的方根的计算置换为单纯的除法运算。进而,在子群数Q是 常数时,预先计算Q的倒数,由此能够将方根的计算置换为单纯的乘法运算,所以能够更削 减运算量。接着,非线性变换单元104将使用式(4)计算出的第2子带对数代表值频谱 AVE4p(p = 0 P-1)输出到平滑化单元105。再次返回到图2,平滑化单元105对于从非线性变换单元104输入的第2子带对数 代表值频谱AVE4p(p = 0 P-1),使用式(5),在频域上进行平滑,并计算对数平滑化频谱 AVE5P (ρ = 0 P-1)。
8
权利要求
1.频谱平滑化装置,包括时间-频率变换单元,将输入的信号进行时间-频率变换而生成频率分量; 子带分割单元,将所述频率分量分割为多个子带;代表值计算单元,对于所述分割出的各个子带,使用算术平均的计算及利用了该计算 结果的乘法运算计算子带的代表值;非线性变换单元,对每个所述子带的代表值进行非线性变换;以及 平滑化单元,将进行了所述非线性变换的代表值在频域上进行平滑。
2.如权利要求1所述的频谱平滑化装置,还包括反非线性变换单元,将平滑后的代表值进行与所述非线性变换相反特性的反非线性变换。
3.如权利要求1所述的频谱平滑化装置,所述非线性变换单元对于所述各个代表值,进行其值越大越增强特性的非线性变换。
4.如权利要求1所述的频谱平滑化装置,所述非线性变换单元进行对数变换作为所述非线性变换。
5.如权利要求1所述的频谱平滑化装置,所述代表值计算单元通过使用所述乘法运算的结果进行几何平均的计算,计算所述子 带的代表值。
6.如权利要求1所述的频谱平滑化装置,所述代表值计算单元通过将各个子带进一步分割为多个子群,对每个所述子群计算算 术平均值,使用进行了所述乘法运算所得的结果,计算几何平均值,从而计算每个所述子带 的代表值,所述乘法运算利用了每个所述子群的算术平均值。
7.如权利要求1所述的频谱平滑化装置,所述代表值计算单元将各个子带进一步分割为多个子群,对每个所述子群计算算术平 均值,计算将每个所述子群的算术平均值相乘所得的值作为每个所述子带的代表值,所述非线性变换单元通过对每个所述子带的代表值进行所述非线性变换,计算每个子 带的中间值,并且计算对于每个所述子带的中间值乘以各个子带内的子群数的倒数所得的 值作为所述非线性变换后的代表值。
8.编码装置,其进行频带扩展编码,该编码装置包括第1编码单元,对输入信号的规定频率以下的低频部分进行编码而生成第1编码信息;解码单元,对所述第1编码信息进行解码而生成解码信号;以及 第2编码单元,通过将所述输入信号的比所述规定频率高的高频部分分割为多个子 带,从所述输入信号或所述解码信号分别估计所述多个子带,从而生成第2编码信息, 所述第2编码单元具备输入所述解码信号并进行平滑的权利要求1至权利要求7中的任一项权利要求所 述的频谱平滑化装置,从所述输入信号或平滑后的所述解码信号分别估计所述多个子带。
9.解码装置,其进行频带扩展解码,该解码装置包括接收单元,接收在编码装置中生成的第1编码信息和在编码装置中生成的第2编码信息,所述第1编码信息为对编码侧输入信号的规定频率以下的低频部分进行编码所得的编 码信息,所述第2编码信息为通过将所述编码侧输入信号的比所述规定频率高的高频部分 分割为多个子带,从所述编码侧输入信号或对所述第1编码信息进行解码所得的第1解码 信号,分别估计所述多个子带,从而生成的编码信息;第1解码单元,对所述第1编码信息进行解码而生成第2解码信号;以及 第2解码单元,通过使用所述第2编码信息,从所述第2解码信号估计所述编码侧输入 信号的高频部分,从而生成第3解码信号, 所述第2解码单元具备输入所述第2解码信号并进行平滑的权利要求1至权利要求7中的任一项权利要 求所述的频谱平滑化装置,从平滑后的所述第2解码信号估计所述编码侧输入信号的高频部分。
10.通信终端装置,包括权利要求1至权利要求7中的任一项权利要求所述的频谱平滑直 ο
11.基站装置,包括权利要求1至权利要求7中的任一项权利要求所述的频谱平滑化装置。
12.频谱平滑化方法,包括时间-频率变换步骤,将输入的信号进行时间-频率变换而生成频率分量; 子带分割步骤,将所述频率分量分割为多个子带;代表值计算步骤,对于所述分割出的各个子带,使用算术平均的计算及利用了该计算 结果的乘法运算计算子带的代表值;非线性变换步骤,对于每个所述子带的代表值进行非线性变换;以及 平滑化步骤,将进行了所述非线性变换的代表值在频域上进行平滑。
全文摘要
公开了在对从语音信号算出的频谱进行了非线性变换之后,进行平滑的结构中,维持良好的语音质量,并且大幅度削减处理运算量的频谱平滑化装置。在该频谱平滑化装置中,子带分割单元(102)将输入频谱分割为多个子带,代表值计算单元(103)对每个子带使用算术平均以及几何平均计算代表值,非线性变换单元(104)对于各个代表值,进行其值越大越增强特性的非线性变换,平滑化单元(105)将该每个子带的非线性变换后的代表值在频域上进行平滑。
文档编号G10L11/00GK102099855SQ20098012838
公开日2011年6月15日 申请日期2009年8月7日 优先权日2008年8月8日
发明者山梨智史, 押切正浩, 森井利幸, 江原宏幸 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1