声音信号复原装置以及声音信号复原方法

文档序号：7914945阅读：112来源：国知局

专利名称：声音信号复原装置以及声音信号复原方法
技术领域：
本发明涉及从频带被限制为窄频带的声音信号复原宽频带的声音信号、以及对变差或者缺损的频带的声音信号进行复原的声音信号复原装置及其方法。
背景技术：
在模拟电话中，通过电话线路送来的声音信号的频带被限制为例如30(Γ3400Ηζ这样的窄频帯。因此，以往的电话线路的音质不能说很好。另外，在便携电话等数字声音通信中，由于比特率的严格的限制，与模拟线路同样地，频带宽度被限制，所以在该情况下也不能说音质好。另外，近年来，伴随着声音压缩技术(声音编码技木)的发展，能够以低比特率对宽频带(例如5(Γ7000Ηζ)的声音信号进行无线传送。但是，发送侧终端以及接收侧终端这双方需要支持对应的宽频带声音编码/解码方法，并且在双方的基站中也需要具备用于宽频带编码的网络，所以仅在一部分的业务通信系统中被实用化，为了在公共电话通信网中实施，不仅在经济上成为大的负担，而且直至普及需要大量的时间。因此，依然未解決以往的模拟电话线路通信以及数字声音通信的音质的问题。因此，针对上述问题，作为在接收侧从窄频带信号虚拟地生成或者复原宽频带信号的方法，例如公开了专利文献1、2。在专利文献I的频带扩展装置中，计算窄频带声音信号的自相关系数而抽出声音的基本周期，井根据该基本周期得到宽频带声音信号。另外，在专利文献2的宽频带声音信号复原装置中，通过基于利用合成的分析法的编码方法对窄频带声音信号进行编码，并对作为该编码的最終結果而得到的音源信号或者声音信号，进行零填充处理(oversampling :过采样)而得到宽频带声音信号。专利文献I :日本专利第3243174号(第3 5页、图I)专利文献2 :日本专利第3230790号(第3 4页、图I)

发明内容
以往的声音信号复原装置由于如上所述构成，所以存在以下叙述的问题。在专利文献I公开的频带扩展装置中，需要抽出窄频带声音信号的基本周期。虽然公开了各种抽出声音的基本周期的方案，但难以正确地抽出声音信号的基本周期。在噪声环境下更加困难。在专利文献2公开的宽频带声音信号复原装置中，具有无需抽出声音信号的基本周期的优点。然而，所生成的宽频带音源信号虽然是从窄频带信号分析以及生成的信号，但由于是通过零填充处理(过采样)而虚拟地生成的信号，所以混入了重叠失真分量，因此存在不适合宽频带声音信号(尤其是高频信号)、且音质变差这样的问题。本发明是为了解决上述那样的问题而完成的，其目的在于提供一种高质量地复原声音信号的声音信号复原装置以及声音信号复原方法。本发明的声音信号复原装置，具备合成滤波器，组合音韵信号以及音源信号，生成多个声音信号；失真评价部，使用规定的失真尺度，评价具有合成滤波器所生成的声音信号的频带中的至少一部分频带的频率分量的比较对象信号与合成滤波器所生成的多个声音信号中的各个声音信号的波形失真，井根据该评价结果，选择多个声音信号中的某一个；以及复原声音信号生成部，使用失真评价部所选择的声音信号，生成复原声音信号。本发明的声音信号复原方法，具备合成滤波步骤，组合音韵信号以及音源信号，生成多个声音信号；失真评价步骤，使用规定的失真尺度，评价具有在合成滤波步骤中生成的声音信号的频带中的至少一部分频带的频率分量的比较对象信号与在合成滤波步骤中生成的多个声音信号中的各个声音信号的波形失真，井根据该评价结果，选择多个声音信号中的某一个；以及复原声音信号生成步骤，使用在失真评价步骤中所选择的声音信号，生成复原声音信号。根据本发明，组合音韵信号以及音源信号来生成多个声音信号，使用规定的失真尺度，分别评价与比较对象信号的波形失真，井根据该评价结果来选择某ー个声音信号而生成复原声音信号，所以能够提供将例如由于频带限制或者噪声压制而导致任意的频带的频率分量欠缺了的比较对象信号高质量地进行复原的声音信号复原装置以及声音信号复原方法。

图I是示出本发明的实施方式I的声音信号复原装置100的结构的框图。图2是示意性地示出本发明的实施方式I的声音信号复原装置100生成的声音信号的曲线图。图3是示出本发明的实施方式2的声音信号复原装置100的结构的框图。图4是示出本发明的实施方式3的声音信号复原装置200的结构的框图。图5是示意性地示出本发明的实施方式3的声音信号复原装置200生成的声音信号的曲线图。图6是示意性地示出本发明的实施方式5的声音信号复原装置200的失真评价部107的失真评价处理的曲线图。图7是不出图I所不的复原声音信号生成部110的变形例的框图。图8是示意性地示出图7所示的复原声音信号生成部110生成的声音信号的曲线图。
具体实施例方式以下，參照附图，详细说明本发明的实施方式。实施方式I.在本实施方式I中，以用于从由于经由电话线路等传送路径而导致频带被限制为窄频带的声音信号生成宽频带的声音信号的声音信号复原装置为例子进行说明，该声音信号复原装置用于导入了声音通信、声音储存或者声音识别系统的汽车导航、便携电话及对讲机等声音通信系统、免提通话系统、TV会议系统以及监视系统等的音质改善、声音识别系统的识别率提闻。图I是示出本实施方式I的声音信号复原装置100的整体结构的图。
在图I中，声音信号复原装置100包括采样变换部101、声音信号生成部102以及复原声音信号生成部110。该声音信号生成部102包括具备音韵信号存储部108和音源信号存储部109的音韵/音源信号存储部105、合成滤波器106、以及失真评价部107。另外，复原声音信号生成部110包括第I频带滤波器103和频带合成部104图2是示意性地示出通过本实施方式I的结构生成的声音信号的图。图2的(a)示出输入到采样变换部101的窄频带声音信号(比较对象信号)。图2的(b)示出采样变换部101输出的已经上采样的窄频带声音信号(进行了采样变换的比较对象信号)。图2的(c)示出失真评价部107从由合成滤波器106所生成的多个宽频带声音信号(声音信号)中选择出的失真最小的宽频带声音信号。图2的(d)示出第I频带滤波器103的输出、即从宽频带声音信号抽出了低频分量和高频分量的信号。图2的(e)示出声音信号复原装置100的输出结果即复原声音信号。另外，图2中的各箭头表示处理的顺序，各曲线图的纵轴表示功率，横轴表示频率。以下，根据图I以及图2，说明该声音信号复原装置100的动作原理。首先，通过未图示的麦克风等而取入的声音以及音乐等被进行了 A/D (模拟/数字)变换之后，以规定的采样频率(例如，8kHz)被采样并且被分割为帧单位(例如，10ms)，进而被频带限制(例如，30(Γ3400Ηζ)而成为窄频带声音信号，并被输入到本实施方式I的声音信号复原装置100。另外，在本实施方式I中，将最终得到的宽频带的复原声音信号的频带设为5(Γ7000Ηζ而进行说明。采样变换部101对于所输入的窄频带声音信号例如以16kHz进行上采样，并通过低通滤波器去除了重叠失真信号之后，作为已经上采样的窄频带声音信号而输出。在声音信号生成部102中，合成滤波器106使用音韵信号存储部108中保存的音韵信号和音源信号存储部109中保存的音源信号来生成多个宽频带声音信号，失真评价部107根据规定的失真尺度(distortion scale)来计算与已经上采样的窄频带声音信号的波形失真，选择并输出失真成为最小的宽频带声音信号。另外，该声音信号生成部102也可以是与例如CELP (Code 一 Excited Linear Prediction :码激励线性预测)编码方式中的解码方法同样的结构，在该情况下，在音韵信号存储部108中保存音韵符号，在音源信号存储部109中预先保存音源符号。音韵信号存储部108采用除了音韵信号以外还ー并具有音韵信号的功率或者增益的结构，以能够表现各种宽频带声音信号的音韵形状(频谱图案)的方式，将大量并且多种多样的音韵信号保存到存储器等存储单元中，根据后述的失真评价部107的指示将音韵信号输出到合成滤波器106。能够使用线性预测分析等公知的方案，从宽频带的声音信号(例如，具有5(Γ7000Ηζ的频带)求出这些音韵信号。另外，关于频谱图案，能够以频谱信号自身、或者LSP (Line Spectrum Pair :线谱对)參数以及倒谱(Cepstrum)等音响參数(acoustic parameter)形式来表现，以能够适用于合成滤波器106的滤波系数的方式进行适当变换即可。而且，为了削减存储量，也可以通过标量量化以及矢量量化等公知的方案，对所得到的音韵信号进行压縮。音源信号存储部109采用除了音源信号以外还ー并具备音源信号的功率或者增益的结构，与音韵信号存储部108同样地，以能够表现各种宽频带声音信号的音源信号形状(脉冲串)的方式，将大量并且多种多样的音源信号保存到存储器等存储单元，根据后述的失真评价部107的指示，将音源信号输出到合成滤波器106。能够使用宽频带的声音信号(例如，具有5(Γ7000Ηζ的频带)和上述音韵信号，通过CELP的方案来学习并求出这些音源信号。另外，关于所得到的音源信号，既可以为了削减存储量而通过标量量化以及矢量量化等公知的方案进行压缩，也可以如多脉冲化以及ACELP (Algebraic CELP :代数码激励线性预测)方式那样通过规定的模型来表现音源信号。另外，还能够如VSELP (Vector SumExcited Linear Prediction :矢量和激励线性预测)编码方式那样采用一并具备从过去的音源信号生成的自适应音源码本(adaptive sound source code book)的构造。另外，合成滤波器106也可以对音韵信号的功率或者増益、和音源信号的功率或者増益分别进行了调整之后进行合成。在该结构的情况下，从I个音韵信号和I个音源信号也能够生成多个宽频带声音信号，所以能够削减音韵信号存储部108以及音源信号存储部109的存储量。失真评价部107评价合成滤波器106所输出的宽频带声音信号与采样变换部101所输出的已经上采样的窄频带声音信号的波形失真。此时，评价失真的频带(规定的频带)仅限定于窄频带声音信号的范围，在本例子中限定于30(Γ3400Ηζ。为了在窄频带声音信号的频带的范围内进行波形失真的评价，例如对于宽频带声音信号和已经上采样的窄频带声音信号这两者，能够使用具有30(Γ3400Ηζ的带通特性的FIR (Finite Impulse Response 有限冲激响应特性)滤波器进行滤波处理之后，利用下式所示那样的平均波形失真或者利用基于欧几里德距离的评价法。式(I)
权利要求
1.ー种声音信号复原装置,具备合成滤波器，组合音韵信号以及音源信号，生成多个声音信号；失真评价部，使用规定的失真尺度，评价具有所述合成滤波器所生成的声音信号的频带中的至少一部分频带的频率分量的比较对象信号与所述合成滤波器所生成的所述多个声音信号中的各个声音信号的波形失真，并根据该评价的结果，选择所述多个声音信号中的某一个；以及复原声音信号生成部，使用所述失真评价部所选择的声音信号，生成复原声音信号。
2.根据权利要求I所述的声音信号复原装置，其特征在干，复原声音信号生成部具有频带合成部，该频带合成部组合比较对象信号与失真评价部所选择的声音信号。
3.根据权利要求I所述的声音信号复原装置，其特征在干，失真评价部对比较对象信号与合成滤波器所生成的多个声音信号中的各个声音信号的、规定的频带的频率分量的波形失真进行评价。
4.根据权利要求3所述的声音信号复原装置，其特征在干，具备采样变换部，该采样变换部对比较对象信号进行采样变换以使其对应于规定的频带，失真评价部对所述采样变换部进行了采样变换的所述比较对象信号与合成滤波器所生成的多个声音信号中的各个声音信号的、所述规定的频带的频率分量的波形失真进行评价。
5.—种声音信号复原方法,具备合成滤波步骤，组合音韵信号以及音源信号，生成多个声音信号；失真评价步骤，使用规定的失真尺度，评价具有在所述合成滤波步骤中生成的声音信号的频带中的至少一部分频带的频率分量的比较对象信号与在所述合成滤波步骤中生成的所述多个声音信号中的各个声音信号的波形失真，并根据该评价的结果，选择所述多个声音信号中的某一个；以及复原声音信号生成步骤，使用在所述失真评价步骤中所选择的声音信号，生成复原声音信号。
6.根据权利要求5所述的声音信号复原方法,其特征在于，复原声音信号生成步骤具有频带合成步骤，在该频带合成步骤中组合比较对象信号与在失真评价步骤中所选择的声音信号。
7.根据权利要求5所述的声音信号复原方法，其特征在干，在失真评价步骤中，对比较对象信号与在合成滤波步骤中生成的多个声音信号中的各个声音信号的、规定的频带的频率分量的波形失真进行评价。
8.根据权利要求7所述的声音信号复原方法,其特征在于，具备采样变换步骤，在该采样变换步骤中对比较对象信号进行采样变换以使其对应于规定的频带，在失真评价步骤中，对在所述采样变换步骤中进行了采样变换的所述比较对象信号与在合成滤波步骤中生成的多个声音信号中的各个声音信号的、所述规定的频带的频率分量的波形失真进行评价。
全文摘要
合成滤波器(106)从声音信号码本(105)中组合宽频带的音韵信号和音源信号来合成多个宽频带声音信号，失真评价部(107)选择从采样变换部(101)输出的与已经上采样的窄频带声音信号的波形失真最小的宽频带声音信号。第1频带滤波器(103)抽出该宽频带声音信号的窄频带以外的频率分量，频带合成部(104)组合到已经上采样的窄频带声音信号中。
文档编号H04M1/00GK102652336SQ20108005506
公开日2012年8月29日申请日期2010年10月22日优先权日2009年12月28日
发明者古田训, 田崎裕久申请人:三菱电机株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：古田训;田崎裕久
技术所有人：三菱电机株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。