信号失真消除装置、方法、程序及记录该程序的记录介质的制作方法

文档序号:7674438阅读:372来源:国知局
专利名称:信号失真消除装置、方法、程序及记录该程序的记录介质的制作方法
技术领域
该发明涉及消除信号的失真(Distortion)的技术。
背景技术
若信号是在有反射和混响的环境下被观测,则将作为在原来的信号中重 叠了反射和混响等的信号而被观测。以下,原来的信号称为"原信号",被观 测的信号称为"观测信号"。此外,由反射和混响等所代表的重叠在原信号中 的失真称为"传递特性"。因此,从观测信号中抽出原信号固有的特征将变得 困难。为消除这种不便,很早开始就尝试有各种信号失真消除处理技术。信 号失真消除处理是从观测信号中去除重叠在原信号的传递特性的处理。
使用图15说明非专利文献1展示的作为以往的信号失真消除处理的 一个 例子的信号失真消除方法。预测误差滤波器计算部分(901 )将观测信号进行 分帧处理,对各帧所包含的观测信号进行线性预测分析,并计算预测误差滤 波器。在本说明书中,滤波器为数字滤波器,在求对信号的样本值作用的所 谓滤波器系数的意义下,有时仅筒称为计算滤波器等。预测误差滤波器应用 部分(902 )将对每个帧进行所述计算的预测误差滤波器应用于该帧的观测信 号。反向滤波器计算部分(903 )计算反向滤波器,该反向滤波器能够使对于 应用了预测误差滤波器之后的信号应用反向滤波器所得的信号的归一化峰值 最大。反向滤波器应用部分(904)通过将经过所述计算的反向滤波器应用于 观测信号而得到信号失真消除后的信号(复原信号)。
非专利文献1: B.W.Gillespie, , H.S.Malvar, ,and D.A.F.Florencio, ,"Speech dereverberation via maximum-kurtosis subband adaptive filtering," IEEE International Conference on Acoustics, Speech, and Signal Processing, pp.3701-3704, 2001.

发明内容
发明要解决的课题上述以往的信号失真消除方法假设,观测信号的各帧内的样本间的相关 是原信号固有特性的作用较大,而横跨帧的样本间的相关是传递特性的作用 较大。上述以往方法基于该假设,将预测误差滤波器应用于经过分帧处理的 观测信号,从而降低观测信号中的原信号固有特性的作用。
但是,该假设是粗略的近似,因此反向滤波器的精度是不充分的。即, 观测信号求得的预测误差滤波器受到传递特性的影响,因此,无法正确地仅 去除原信号固有的特性。因此,由预测误差滤波器应用后的信号所求得的反 向滤波器的精度下降。结果,对观测信号应用反向滤波器所得的信号在与原 本的原信号的比较下,其精度并不高。
因此,本发明的目的在于,通过求精度高的反向滤波器,从观测信号中 消除由来于传递特性的失真而得到精度高的复原信号。
解决课题的方案
为了解决所述课题,本发明的信号失真消除装置包括反向滤波器应用 单元,在满足了规定的反复终止条件时,将适用于观测信号的滤波器(以下, 称为反向滤波器)应用于观测信号,并将该结果作为复原信号输出,在不满 足反复终止条件时,将反向滤波器应用于观测信号,并将该结果作为特定信
号输出;预测误差滤波器计算单元,将特定信号进行分帧,输出对各帧的特
单元,求对于各帧的特定信号拟合了应用与该帧对应的预测误差滤波器所得 的各信号(以下,称为修正估计值)的全帧中的修正估计值(以下,称为修
正估计值系列)在其全样本间独立的反向滤波器,并输出该反向滤波器;以 及控制单元,使反向滤波器应用单元、预测误差滤波器计算单元、反向滤波 器计算单元反复执行,直到满足反复终止条件。
在该发明中,对于将用于消除传递特性的反向滤波器应用于观测信号所 得特定信号,求应用根据该特定信号求出的预测误差滤波器所得的信号(修 正估计值系列)在其全样本间独立的反向滤波器。然后,通过将满足规定的 反复终止条件时的反向滤波器应用于观测信号而得到复原信号。
在所述的信号失真消除装置中,预测误差滤波器计算单元也可以作为求 全帧中各修正估计值的方差的总和最小时的预测误差滤波器,或全帧中各修 正估计值的方差的对数值的总和最小时的预测误差滤波器,对各帧的特定信 号进行线性预测分析,并输出每个帧的预测误差滤波器;反向滤波器计算单元也可以将所述修正估计值系列在其全样本间独立的所述反向滤波器作为全 帧中各修正估计值的归 一化峰值的总和最大时的反向滤波器而求,并输出该 反向滤波器。
该结构规定相互信息量作为修正系列的独立性的尺度,并通过交替变量 法求使该相互信息量最小化的预测误差滤波器和反向滤波器。具体内容将在 后面叙述。
或者,在所述的信号失真消除装置中,预测误差滤波器计算单元也可以 作为求全帧中各修正估计值的方差的总和最小时的预测误差滤波器,或全帧 中各修正估计值的方差的对数值的总和最小时的预测误差滤波器,对各帧的
特定信号进行线性预测分析,并输出每个帧的预测误差滤波器;反向滤波器 计算单元也可以将所述修正估计值系列在其全样本间独立的所述反向滤波器 作为全帧中各修正估计值的方差的总和最小时的反向滤波器或者全帧中各修 正估计值的方差的对数值的总和最小时的反向滤波器而求,并输出该反向滤波器。
该结构规定相互信息量作为修正系列的独立性的尺度,并通过交替变量 法求使该相互信息量最小化的预测误差滤波器和反向滤波器,但能够不使用 信号的高阶统计量,而通过交替变量法求预测误差滤波器和反向滤波器。
所述的信号失真消除装置中可以是如下的装置结构,使预白化处理前置,
括以下单元的信号失真消除装置白化滤波器计算单元,输出对观测信号进 行线性预测分析所得的白化滤波器;白化滤波器应用单元,将白化滤波器应 用于观测信号而输出白化信号;反向滤波器应用单元,在满足了规定的反复 终止条件时,将适用于白化信号的滤波器(以下,称为反向滤波器)应用于 白化信号,并将该结果作为复原信号输出,在不满足反复终止条件时,将反 向滤波器应用于白化信号,并将该结果作为特定信号输出;预测误差滤波器 计算单元,将特定信号进行分帧,输出对各帧的特定信号进行线性预测分析 所得的每个帧的预测误差滤波器;反向滤波器计算单元,求对各帧的特定信 号拟合了应用与该帧对应的预测误差滤波器所得的各信号(以下,称为修正 估计值)的全帧中的修正估计值(以下,称为修正估计值系列)在其全样本 间独立的反向滤波器,并输出该反向滤波器;以及控制单元,使反向滤波器 应用单元、预测误差滤波器计算单元、反向滤波器计算单元反复执行,直到满足反复终止条件。
为了解决所述课题,本发明的方法是具有以下步骤的信号失真消除方法 反向滤波器应用步骤,在满足了规定的反复终止条件时,反向滤波器应用单 元将适用于观测信号的滤波器(以下,称为反向滤波器)应用于观测信号, 并将该结果作为复原信号输出,在不满足反复终止条件时,反向滤波器应用
单元将反向滤波器应用于观测信号,并将该结果作为特定信号输出;预测误
差滤波器计算步骤,预测误差滤波器计算单元将特定信号进行分帧,输出对
波器计算步骤,反向滤波器计算单元,求对于各帧的特定信号拟合了应用与 该帧对应的预测误差滤波器所得的各信号(以下,称为修正估计值)的全帧 中的修正估计值(以下,称为修正估计值系列)在其全样本间独立的反向滤
波器,并输出该反向滤波器;以及控制步骤,控制单元使反向滤波器应用步 骤、预测误差滤波器计算步骤、反向滤波器计算步骤反复执行,直到满足所 述反复终止条件。
此外,所述的信号失真消除方法中可以是如下的方法,使预白化处理前
有以下步骤的信号失真消除方法白化滤波器计算步骤,白化滤波器计算单 元输出对观测信号进行线性预测分析所得的白化滤波器;白化滤波器应用步 骤,白化滤波器应用单元将白化滤波器应用于观测信号而输出白化信号;反 向滤波器应用步骤,在满足了规定的反复终止条件时,反向滤波器应用单元 将适用于白化信号的滤波器(以下,称为反向滤波器)应用于白化信号,并 将该结果作为复原信号输出,在不满足所述反复终止条件时,反向滤波器应 用单元将反向滤波器应用于白化信号,并将该结果作为特定信号输出;预测 误差滤波器计算步骤,预测误差滤波器计算单元将特定信号进行分帧,输出 对各帧的特定信号进行线性预测分析所得的每个帧的预测误差滤波器;反向 滤波器计算步骤,反向滤波器计算单元,求对于各帧的特定信号拟合了应用 与该帧对应的预测误差滤波器所得的各信号(以下,称为修正估计值)的全 帧中的修正估计值(以下,称为修正估计值系列)在其全样本间独立的反向 滤波器,并输出该反向滤波器;以及控制步骤,控制单元使反向滤波器应用 步骤、预测误差滤波器计算步骤、反向滤波器计算步骤反复执行,直到满足 反复终止条件。根据使计算机具有作为本发明的信号失真消除装置功能的信号失真消除 程序,能够使计算机作为信号失真消除装置进行动作处理。并且,根据记录 了该信号失真消除程序的计算机可读取的程序记录介质,能够使其它计算机 具有作为信号失真消除装置的功能,以及使信号失真消除程序流通等。
发明效果
本发明中,不是使用从观测信号求得的预测误差滤波器来降低观测信号 中的原信号固有特性的作用,而是使用对观测信号(假设的)应用反向滤波 器所得的特定信号(假设的复原信号)所求的预测误差滤波器来降低观测信 号中的原信号固有特性。从特定信号求得的预测误差滤波器不易受到传递特 性的影响,因此能够更加正确地去除原信号固有的特性。以将这样的预测误 差滤波器应用于特定信号所得的信号(修正估计值系列)在全样本间独立所 求出的反向滤波器能够高精度地消除传递特性,因此通过将这样的反向滤波 器应用于观测信号,能够得到消除了来源于传递特性的失真的精度高的复原 信号。


图1是表示了用于说明本发明的原理的模型机构的框图。
图2是表示实施方式1的信号失真消除装置(1 )的硬件结构例的图。 图3是表示实施方式1的信号失真消除装置(1 )的功能结构例的功能方框图。
图4是表示信号失真消除装置(1 )的反向滤波器计算部分(13 )的功能 结构例的功能方框图。
图5是表示实施方式1的信号失真消除处理的流程的处理流程图。
图6是表示实施方式2的信号失真消除装置(1 )的功能结构例的功能方框图。
图7是表示实施方式2的信号失真消除处理的流程的处理流程图。
图8是表示将观测信号长度N变为5秒、10秒、20秒、l分、3分时, 反复次数&和D5Q值的关系的图。
图9 (A)是不包含混响的声音的声谱图,图9 (B)是包含混响的声音 的声谱图,图9 ( C )是消除混响后的声音的声镨图。
图10 (A)是用于说明消除混响声音的LPC频谱失真的时间变动的图,图10 (B)是对应区间的原声音信号的摘录。
图11是表示实施方式3的信号失真消除装置(1 )的反向滤波器计算部
分(13)的功能结构例的功能方框图。
图12是表示实施方式3的信号失真消除处理的流程的处理流程图。
图13是显示了观测信号长度N设为3秒、4秒、5秒、IO秒时的RASTI
的值的图。
图14是表示消除混响前后的能量衰减曲线的例子的图。 图15是用于说明以往技术的功能方框图。
具体实施例方式
§ 1本发明的理论
以下,在说明实施方式之前,先说明本发明的理论。 以下的说明中,只要没有特别的声明,设信号源为l了。
1.1信号
作为本发明的对象的信号广泛包含人的声音、音乐、生物信号、用传感 器观测测量对象的物理量的电信号等信号。更加优选是,能够作为自回归 (Autoregressive:AR )过程来表现的信号,或者表现理想的信号即可。例如 语音信号是通常作为阶段平稳的自回归过程所表现的信号,即看作是使独立 同一分布信号(i丄d.:Independent and Identically Distributed )中表示音韵性的 AR系统作用的信号(参照参考文献1 )。
以下,例举语音信号作为信号的代表例子,说明本发明的理论。 (参考文献1) LR.Rabiner, R.W.Schafer, "Digital Processing of Speech Signals", Bell Laboratories, Incorporated, 1978. 1.2语音信号的模型化
首先,将原信号、即语音信号s(t)作为满足以下3个条件的信号进行模 型化。语音信号s(t)是由阶段平稳的AR过程生成的。
由该[条件l],设AR过程的阶数为P、设认为稳定的区间长度为W样 本而将语音信号s(t)进行分帧,则第i帧的语音信号s,(n)表示为如式(1) 所示。式(2)表示第i帧的语音信号Si(n)的样本和分帧前的语音信号s(t) 的样本之间的对应。即,第i帧的n号样本在语音信号s (t)中相当于(i-1) W+n号的样本。在式(1)及式(2)中,bi(k)表示线性预测系数,ej(n)表示修正。 其中,1^r^W、 N是全部样本数。以下,若没有特别的声明,则参数
n表示l帧的样本号,参数t表示全部的样本号。此外,设全帧数为F。
<formula>formula see original document page 12</formula>再者,对于第i帧中的n号修正ei (n),也能够表示第i帧的n号修正e; (n) 和对于分帧前的语音信号s(t)的修正e(t)之间的对应。这种情况下,第i帧的 n号修正ei (n)在修正e (t)中相当于(i陽l) W+n号的修正,e; (n) =e ((i-l) W+n) 成立。
对式(l)进行z变换。设左边的z变换为Si(Z),右边第二项的z变换 为Ei(Z), Bi(z)=Zk=iPbi(k)z-k,则右边第一项变成Bi(z)Si(Z)。因此,式(l) 的z变换为,(1-Bi(z))S,(Z卜Ej(Z)。再者,z"在时域中相当于1抽头(tap) 延迟因子。以后,将时域信号(抽头加权系数)用小字符,z域信号(传递函 数)用大字符分别表示。1- Bj(z)必须满足最小相位性,要求"1- Bi(z)在复 平面的单位圓内有着所有的零点"。属于第i帧的修正系列...,ei(W)独立且属于同一分布。修正系 列ei(l), ...,ei(W)的概率分布的平均及失真度(3阶累计量)为0,峰值(4 阶累计量)为正。并且,属于不同帧i、 j[的]的修正ei(n)和ej(n')之间也同样 是独立的。但是,并不限于它们必须属于同一分布。 [条件3]预测误差滤波器1- Bj (z)在不同的帧之间没有共同的零点。
根据式(1)及式(2),语音信号s(t)表示为如式(3)所示。[']是高 斯符号。
<formula>formula see original document page 12</formula>这时,[条件2]可表达为,"修正过程e(t)是时间上独立的信号。且,它 的统计性质(或是统计量)在帧内是恒定的"。此外,[条件3]可表达为,"线 性预测系数{ bj (k)} k=1p没有时不变的极点"。 1.3观测信号的模型化
接着,用M个话筒观测语音信号而得到观测信号,并将此时的观测信号
尸进行模型化。其中,M是M^1的整数。
由m号(lSm^M)话筒观测的包含混响的观测信号xm(t),利用/人声源 至m号话筒的路径的传递函数Hm(z)的抽头加权系数(hm(k);O^^K;设K为沖 击响应的持续时间。},如式(4)所示进行模型化。这里,例举混响作为语 音信号的情况的代表例子,用混响替换传递特性来说明。但是,并不是将传 递特性限定为混响。
&(0= i禱W-A:) (4)
将M个观测信号统一来表达,则可表示成如式(5 )所示。但是,式(5 )
中,X(,[X(t),…,XM(t)]T, h(k):[h"k),…,hM(k)]T。 〖
x(0= (5)
1.4消除信号失真的原理
消除信号失真后的复原信号y(t)是利用多通道反向滤波器(GJz); lSm^M )的抽头加权系数(gm(k); l^rn^M , (^k^L;L是反向滤波器的阶数},根
据式(6)来计算。在本发明中,仅由观测信号X"t),...,XM(t)估计反向滤波器
系数gm(k)。
71/ 丄
3<0二 S " (6)
m二l A:二O 1.5本发明的基本原理
本发明的基本原理以并列估计传递函数{Hm(z); 1 ^rn^M }的反向滤波器 {Gm(z); l^r^M }和作为AR系统的滤波器{1/(1- B;(z)); l效}的反向滤波 器的预测误差滤波器U-Ai (z); l^i^F }为主要特征。
为说明该基本原理,图1中表示容纳了所述的模型结构的整个系统的结 构框图。根据所述模型化,原信号s(t)可看作对每个帧的修正系列 ei (1) , ..., eJW)应用AR系统的滤波器1/(1- B;(z))所得的信号Si(n)的顿结合, 可以说观测信号x(t)是传递函数H(z)对原信号s(t)作用的信号。并且,信号失 真消除处理成为对观测信号x(t)作用反向滤波器G(z)而得到复原信号y(t)的处 理。这时,将由信号失真消除处理所得的复原信号y(t)进行帧分割,对于各自 的帧应用根据各自的信号求得的预测误差滤波器l-Ai(z)所得到的修正估计 值di(l),…,di(W)与修正系列ei(l),…,ej(W)—致是所期望的。如果预测误差滤波器l-Ai(z)的输出信号dj(n)满足di(n" ei(n) [l狄IWW],则在[条件
3]的条件下将表示成为I]m-lMHm(Z)Gm(zhl (关于数学证明,请参照参考文献
A)。即,可以说s(t),(t)。这时,l-Ai(z)与l-Bi(z)等价。 (参考文献A ) Takuya Yoshioka, TakafUmi Hikichi, Masato Miyoshi, Hiroshi G. Okuno: Robust Decomposition of Inverse Filter of Channel and Prediction Error Filter of Speech Signal for Dereverberation, Proceedings of the 14th European Signal Processing Conference (EUSIPCO 2006), CD-ROM Proceedings, Florence: 2006.
但是,实际上,不能将修正e,(n)[13^F, 1^15W]作为信号失真消除装置的 输入信号来利用。图1所示的系统中,从各修正系列ei(n)得到观测信号x(t) 的一系列过程是模型过程,实际上无法知道或很难知道各修正系列ei(n)、滤 波器1/(l-Bi(z))和传递函数H(z),能够利用的信息只有观测信号x(t)。因此,
根据所述[条件2],估计反向滤波器Gm(Z)和预测误差滤波器l-Ai(Z),以将第
i帧的修正估计值di(l),...,di(W)结合所得的全帧中的修正估计值系列在它的 全样本间独立,即修正估计值系歹'J d,(l),...,d,(W),…,di(l),…,di(W),... dF(i;>,...,dF (W)独立。
以对比以往的方法的形式来叙述该方法。以往方法是将反向滤波器作为 以下问题的解而得到的"将根据观测信号而求得的预测误差滤波器应用于 观测信号,求对于预测误差滤波器应用后的信号应用反向滤波器所得的信号 的归一化峰值最大时的反向滤波器"。对此,本发明是将反向滤波器作为以下 问题的解而得到的"对于将反向滤波器应用于观测信号所得的信号,求使应 用根据该信号求出的预测误差滤波器所得信号在全样本间为独立时的反向滤 波器"。该问题中必须注意的是,预测误差滤波器根据将反向滤波器应用于观 测信号所得的信号而求,因此,不仅是反向滤波器,还要一同求预测误差滤 波器。
该问题可根据与ICA (Independent Component Analysis)相同的思考方式 来公式化。这里是从将相互信息量最小化的观点出发来进行说明,但也可以 在例如以使对数似然最大化的方针进行公式化。不管怎样,也只不过是对问 题的近似方法的不同。
作为独立性的尺度使用相互信息量(Kullback-Leibler信息量),则需要解 决的问题如式(7 )所示被公式化。其中,设g=[glT,...,gMT]T 、gm=[gm(0),…,gm(L)]T、 a=[aiT,—,aFT]T、 ai=[ai(l) ,,",ai(P)]T, a'(k)表示预测误差
滤波器的系数。I(U!,...,Un)表示概率变元Ui之间的相互信息量。此外,g和a
加上符号"的是应当得到的最优解。T表示转置。
(i,W二argmin/(^(l),…,《(『),…,^7(l),…,^F(^)) (7)
约束条件 llgl卜l(其中,H-ll表示模) 1 - Ai (z)在复平面的单位圓内具有所有的零点[1 S^F]。
即使修正估计值系歹lld"l),…,山(W),…,di(l),…,di(W),…
dF(l),...,dF(W)的振幅变为常数倍,相互信息量I也不会变化。式(7)的约
束条件[l]是用于排除该振幅的不定性的条件。式(7)的约束条件[2]是用于
与所述[条件l]对应,将预测误差滤波器限制在最小相位系统的条件。以下,
将I看作是以修正估计值系列作为输入,输出它们之间的相互信息量的函数,
称为损失函数。
1.6损失函数的推导
为执行式(7 )的最优化,必须由有限长度的信号系列(d,(n); lSn:SW }
估计损失函数I(d"l),...,dF(W))。若将(多变量)概率变元U的微分熵记为 D(U),贝'j I(d,(l),...,dF(W))由式(8)定义。其中,d-[dF丁,…,d。T、
<formula>formula see original document page 15</formula>
设y<formula>formula see original document page 15</formula>, d使用y,表示为d=Ay。其中, 矩阵A由式(9)和式(10)表示。 [数8]
<formula>formula see original document page 15</formula><formula>formula see original document page 16</formula>(10)
因此,D(d)表示为式(11 )。 Z)(一DO) + logde" (11)
多变量概率变元u的协方差矩阵记为nu),则对于式(ii)的右边第二
项,nd)二E(ddThAE(yy、AT-AHy)AT成立,所以式(12)成立。 log de"=会(log det Z (d) — log det 2 (力) (12)
将式(ll)、式(12)带入式(8),则得到式U3)。其中,cj(U)2 率变元U的方差。
<formula>formula see original document page 16</formula>
.示概
f w 1 广1 、
二Z2:D"如))—^ogdetZ^H slogdetSOO —D(力
2 、2
/=1 "=i f Pf广
^ w门 , 二-ZZ fogcrfe("))2-
,广F ff
+ -
Z》oga咖)2-logdet,
1 、
+
2
1ogdetlX力-D(力
1 +
(13)
式(13 )中J(U)是(多变量)概率变元U的负熵(negentropy )。负熵取
16表示U的非高斯性程度的非负值,只有在U为高斯分布的情况下取0。 C(U,,…,Un)由式(14)定义。C(Ub…,Un)取表示概率变元Uj之间的相关程度
的非负值,只有在这些概率变元之间没有相关的情况下取o。
<formula>formula see original document page 17</formula>但是,若设s4s/,…,s。T、 s「[Si(W),…,s《l)]T,则J(y)=J(s)=constant (证 明略),因此,式(13)可以进一步筒化如式(15)所示。
iw,…,w<formula>formula see original document page 17</formula>《要根据以上求式(16)的最优化问题即可。
<formula>formula see original document page 17</formula> llgl卜l(其中,l卜ll表示模) 1 - A; (z)在复平面的单位圆内具有所有的零点[1 ^i^F]。
1.7根据交替变量法的最优化
对于式(16),根据交替变量法将g和a进行最优化。即,若将第r次反
复中的g和a的估计值分别表示为gAW、 aA(",则根据式(17)和式(18)的
交互的最优化得到被更新的估计值gA"+')、 aA(r+1)。再者,g"和a"表示符号A加
在了 g、 a的各自的上面。例如,若设反复次数的上限为Rp则第R,次得到 的gMW+')、 a"R""为式(16)的最优解。上标字符Ri为Rj。
,<formula>formula see original document page 17</formula>[约束条件]
mA (r) g=g 1 - Ai (z)在复平面的单位圓内有着所有的零点[1 SSF]。
<formula>formula see original document page 17</formula> <formula>formula see original document page 17</formula>[2] <formula>formula see original document page 18</formula>式(17)的目的在于,根据用于消除传递特性的反向滤波器的当前的估 计值来估计用于消除原信号的固有特性的预测误差滤波器。同样,式(18) 的目的在于,根据预测误差滤波器的当前的估计值来估计反向滤波器。通过 反复这两类的最优化,以使修正估计值系列 d,(l),...,d!(W),…,di(l),…,di(W),…dF(l),…,dF(W)相互独立,从而能够将 反向滤波器和预测误差滤波器并行估计。因此,这里的反复对于反向滤波器 的高精度的估计很重要。但是,由图8明显看出,随着处理的观测信号长度 变长,即使反复次数为1次也能得到一定程度的效果。因此,本发明中,反 复次数可以是l次。 1.8a的最优化
本发明中如下进行式(17)的最优化。
首先需要注意的是,相对于C(d,(l),…,dKW))是与dj(n)的二阶统计量关 联的值,J(dj(n))是与d《n)的高阶统计量关联的值。二阶统计量只提供信号的 振幅信息,但高阶统计量还提供相位信息。因此, 一般,包含高阶统计量的 最优化有推导非最小相位系统的可能性。所以,由l-A,(z)为最小相位系统的 约束条件,在a的最优化中解决式(19)的最优化问题。
<formula>formula see original document page 18</formula> (19)
约束条件 [l]g=gA(r) 1-Ai(z)在复平面的单位圓内具有全部的零点[l^i^F]。
C(d"l),…,dF(W))由式(20)给出。<formula>formula see original document page 18</formula> (20)
这里,矩阵A如式(9)和式(10)所示是上三角矩阵,其对角分量全
部为1,因此,logdetA=0。通过将该式代入式(12),得到式(21)的关系。 <formula>formula see original document page 18</formula>(21)
因此,式(19)与式(22)的最优化问题是等价的。再者,必须注意到
式(22)是反映了所述[条件2]的表现。要说明式(22)的话,可以说式(22)
是求将第i帧中的修正估计值di(l),…,di(W)的方差的对数值在全帧中相加的值最小时的a。
<formula>formula see original document page 19</formula>约束条件 [1] g=gAW l-Ai(z)在复平面的单位圆内有着全部的零点[1SSF]。
解决由式(22)表示的最优化问题与对于将g"W给出的反向滤波器应用 于观测信号所得的特定信号在各帧中进行线性预测分析是等价的, 一定能够 得到最小相位预测误差滤波器。关于线性预测分析,请参照所述参考文献l。
再者,在式(22)中,将第i帧的修正估计值di(l),…,di(W)的方差的对数 值在全帧中的总和最小时的a作为a一+"来求,但不是限定于此。所述各式中
没有清楚写明对数函数的底数(base), —般来说将底数设为10或者纳披尔 数是惯例,不管怎样,底数都要比1大。这时,对数函数是单调递增函数, 所以能够将第i帧的修正估计值dj(l),…,di(W)的方差在全帧中的总和最小时 的a作为a^+"来求。 1.9g的最优化
本发明中,如下进行式(18)的最优化。
如上所述,C(d,(l),…,dF(W))是有关(di(n); 1S^F, 1^1^¥}的相关程度的指 标,但在第(r+l)次的a的最优化中被最小化,因此与Zi^L^Wj(di(n))相比, 可以忽略。所以在g的最优化中,解决式(23)的最优化问题。
<formula>formula see original document page 19</formula>
(23)
约束条件 [1] a=aA(r+1) [2] llg卜l
J(di(n))可根据[条件2],由式(24)进行近似。该详细内容请参照参考文 献2。但是,对于概率变元U, K4(U)表示U的峰值(4阶累计量)。式(24) 的右边称为第i帧中的归一化峰值。
(参考文献 2 ) A.Hyvarinen, J.Karhunen, E.0ja, "INDEPENDENT COMPONENT ANALYSIS", John Wiley & Sons, Inc. 2001.^4(0))'
(24)
根据[条件2],语音信号的修正的峰值为正,所以k4(di(n))/a(di(n))"为正。 因此,式(23)的最优化问题归结为式(25)的最优化问题。cj(di(n),k4(dj(n)) 是根据[条件1]中说明的语音信号的局部恒定性,由各帧内的样本进行计算。 式(26)中,添加了 1/W,不过这只是为了后续计算的方便,并不会对由式 (25)求g的最优解产生影响。由式(25)和式(26),归一化峰值在全帧中 的总和最大时的g成为gA(f+1)。再者,必须注意到式(25)和式(26)是反映 了[条件2]的表现。若说明式(25)和式(26),则可以说它们求将第i帧中的 归一化峰值在全帧中相加的值最大时的g。 g (r+1)=argmaxg (25)
/q"("))
2二丄SS 力
(26)
约束条件 [1] af) [2] II g 11=1
根据式(25 )求g的最优解,只要求用g将Q进行微分的式子等于零时 的值即可。 一般来讲,该解根据式(27)表示的更新规则而求。g'除以g'的 模是为了施加所述约束条件[2]。 n(u)表示学习率。u表示g的最优化中的更
新次数。
(27)
式(27)中,VQg由式(28)和式(29)给出
W W ag
K丄)
(28)<formula>formula see original document page 21</formula>式(29)中,di(n)由式(30)给出,Vmi(n)是由式(31)和式(32)给出。x^(n)是由m号的话筒观测的观测信号的i号帧的信号。<formula>formula see original document page 21</formula>= + (32)§2基于二阶统计量的信号失真消除所述的以往方法的信号失真消除方法需要较长时间的观测信号(例如是 20秒左右。)。这是因为一般计算像归一化峰值这样的高阶统计量需要大量的 观测信号的样本。但是,实际上,很多情况下是无法利用这样长时间的观测 信号的。因此,以往方法的信号失真消除方法,其应用领域是极为有限的。再者,高阶统计量的计算是较为复杂的,因此,用以往方法的信号失真 消除方法,装置的结构容易变得复杂。因此,说明在观测信号为较短时间(例如是3秒到5秒程度。)的情况下 也有效,且计算比以往容易的信号失真消除原理。该原理只利用信号的二阶 统计量,由§ 1中说明的本发明的基本原理所派生。 2.1基于二阶统计量的信号失真消除原理基于二阶统计量的信号失真消除中,在所述3个条件中,设定以下两个 条件。[条件4]M^2。即,使用多个话筒。[条件5] Hm^hm(k)^。k在不同的话筒m之间没有共同的零点。在所述式(16)的最优化问题中求出使包含有关高阶统计量的值的负熵J和表示概率变元之间的相关程度的指标C的值最小化的a和g。表示概率变元之间的相关程度的指标C由二阶统计量所规定。因此,将需要解决的最优化问题由式(33)公式化。<formula>formula see original document page 22</formula>参考式(21),则式(33 )的最优化问题将转化为式(34 )的最优化问题。 再者,需要注意式(34)是反映了所述[条件2]的表现。若说明式(34),则 可以说式(34 )是求将第i帧中的修正估计值di(l),…,dj(W)的方差的对数值在 全帧中相加的值最小时的g和a。<formula>formula see original document page 22</formula>)可是,所述的[条件4]和[条件5]成立时,多通道的观测信号可以作为根 据来自声源的原信号而被驱动的AR系统来捕捉(参照参考文献3 )。这意味 着能够将反向滤波器G的最前头抽头如式(35 )进行固定。但是,与m=l对 应的话筒是最接近声源的话筒。(参考文南史3 ) K. Aded-Meraim, E. Moulines, and P. Loubaton. Prediction error method for second-order blind identification. IEEE Trans. Signal Processing,Vol.45, No.3, pp. 694-705, 1997.<formula>formula see original document page 22</formula>将由式(34)和式(35)规定的g作为系数的反向滤波器G按照式(6) 应用于观测信号x(t),从而得到传递特性被消除的复原信号y(t)。 2.2a的最优化对于式(34),根据交替变量的方法将g和a进行最优化。在固定了反向滤波器的系数gm(k)的状态下,关于预测误差滤波器的系数 ai(k),将式(34)的损失函数最小化。这时,注意以下两点。第一点在于g二[gZ,…,gMT是被固定的,因此作 为反向滤波器G的输出的复原信号y(t)在预测误差滤波器的最优化中是不变 的。第二点在于,i号帧中的预测误差滤波器的系数ai(l),…,ai(P)是仅对 di(l),…,di(W)有用。因此,在各个帧中,只要估计预测误差滤波器的系数ai(l),…,a,(P)以使 Zn—Wlogcj(di(n))2最小化即可。由[条件2],修正估计值d《l),…,d,(W)的方差在帧内是恒定的,因此Zr^WlogcJ(di(n))z的最小化与W^(d扭)^的最小化等价。 *符号表示乘法。方差o(di(n))2可作为〈d,(n)2〉『!w计算。但是,< di(n)2〉n=1 表示使用相当于1帧的修正估计值di(l),…,d,(W)所计算的di(n)的2次方平均。 结果,系数ai(k)作为W*< di(n)2>n=1w、即di(n)的2次方总和最小时的aj(k)而 被估计。这样的系数ai(k)根据线性预测分析的方法而计算。再者,这里是对将第i帧中的修正估计值di( 1),…,d,(W)的方差的对数值在 全帧中的总和最小时的a作为a",来求进行了说明,但并不是限定于此。如 上所述,可将第i帧中的修正估计值di(l),…,di(W)的方差在全帧中的总和最小 时的a作为a^+"来求。 2.3g的最优化在固定了预测误差滤波器的系数ai(k)的状态下,关于反向滤波器的系数 gm(k),将式(34)的损失函数最小化。与反向滤波器的系数gm(k)有关的损失函数的最小化中使用梯度法。若使 用[条件2],则式(34 )的最优化问题被转化为式(3 6 )的最优化问题。 rF / ,\『g = argmm(36)就根据式(36 )求g的最优解来说,求将2>1 log< di(n)2>n=1w用g微分的 式子等于0时的解即可。该解一般可根据式(37)表示的更新规则而求。5 表示学习率。lSm^M、 15k5L。再者,在式(37)中不得不注意到,由式(35) 的条件,II g II =1的约束条件没有^f皮施加。同样,由式(35 )的条件,k的取 值范围是lSk^L。工〈J,'(")v脂'("- ,w' 二 g柳w+^ :e 1," (")/二1 物2〉v"" (") 二 (") - S fl/ W (" - " ( 3 8 )与所述式(29)或者所述非专利文献1所记载的式(3)相比,很明显, 式(37)的右边第二项表示为二阶统计量,该计算中不需要高阶统计量。因此,计算高阶统计量在短时间的观测信号的情况下也同样有效,计算本身也六且 谷勿。再者,式(36)中,将第i帧的修正估计值di(l),…,di(W)的方差的对数值在全帧中的总和最小时的g作为g"来求,但不是限定于此。所述各式中没有清楚写明对数函数的底数(base), 一般来说将底数设为10或者纳披尔数是惯例,不管怎样,底数都要比1大。这时,对数函数是单调递增函数,所以能够将第i帧的修正估计值d,(l),…,d,(W)的方差在全帧中的总和最小时的g 作为gA来求。这种情况下,不能应用式(37)所示的根新规则,重新求将Zm^ dj(n)V『,用g微分的式子等于O时的解即可。由于该结果得到的更新规则可 用与ICA同样的思考方式被公式化,所以省略。 §3预白化本发明的信号失真消除中可以应用预白化。通过将观测信号进行预白化, 最优化计算的稳定化,特别是更新规则的高速收敛变得可能。通过X阶的线性预测分析来计算用于白化各话筒得到的观测信号系列全 体(Xm(t);12^N》的滤波器(白化滤波器)的系数(fm(k);0^^X〉。根据式(39),将所述白化滤波器应用于各话筒所得的观测信号xm(t)。 Wm(t)表示将m号话筒所得的观测信号xjt)白化后的信号。<formula>formula see original document page 24</formula>(39) 这时,式(31 )和式(38)变更为式(40)、式(32)变更为式(41 )即可。尸<formula>formula see original document page 24</formula> (40)<formula>formula see original document page 24</formula>(41)§ 4实施方式以下,参照

本发明的实施方式。作为本发明的实施方式,并不 限定于后述的各实施方式,只要是实现各节中说明的原理的实施方式既可。 <实施方式1>实施本发明的实施方式1时,按照以下步骤处理由传感器得到的观测信 号。这里,以具体说明实施方式的观点出发,将语音信号作为信号例举进行 说明。再者,在说明实施方式l之前,先概括说明观测信号以及分帧处理。 通过未图示的传感器(例如,话筒)得到的模拟信号(该模拟信号中叠加着来源于传递特性的失真。),例如以8000Hz的采样频率而被采样,变换成 被适当量化的离散信号。以下,将该离散信号设为观测信号。执行从模拟信 号到观测信号的A/D变换等所需要的构成元素(方式),不论是哪一种都根 据公知技术的常用方式来完成,因此省略说明及图示。 ((分帧处理))未图示的信号截取单元从离散信号在时间轴方向以 一定时间幅度移动起 点,并将规定时间长度的离散信号作为帧进行截取。例如将200样本点(8000Hzx25ms )长度的离散信号每隔80样本点(8000Hzxl0ms ) —边移动 起点一边进行截取。各帧的截取,只要将公知的窗函数(例如,哈明窗、高 斯窗、矩形窗等)应用于离散信号即可。基于应用窗函数的帧截取根据公知 技术的常用方式来完成。说明用计算机(通用机)执行本发明的实施方式1的信号失真消除装置(1 )时的硬件构成例子。如图2所示,信号失真消除装置(l)包括可连接键盘、指示器等的输 入部分(11 );可连接液晶显示器、CRT (Cathode Ray Tube)显示器等的输 出部分(12);可连接能够与信号失真消除装置(1 )外部的通信装置(例如, 通信电缆、LAN卡、路由器、调制解调器等)进行通信的通信部分(13); DSP ( Digital Signal Processor ) ( 14 )[也可以是CPU( Central Processing Unit )。 此外,也可以包括高速緩冲存储器和寄存器(19)等。];作为存储器的RAM(15 )、 ROM ( 16 );作为硬盘、光盘、半导体存储器等的外部存储装置(17 ); 以及用于能够在这些输入部分(11 )、输出部分(12)、通信部分(13)、 DSP(14)、 RAM ( 15)、 ROM ( 16)、外部存储装置(17)之间进行数据的交换 而连接的总线(18)。此外根据需要,也可以在信号失真消除装置(1)中设 置可读耳又CD-ROM( Compact Disc Read Only Memory )、 DVD( Digital Versatile Disc)等存储介质的装置(设备)等。信号失真消除装置(1 )的外部存储装置(17)中存储着用于消除信号失 真的程序以及该程序的处理中所需要的数据(观测信号)等[不限定于外部存 储装置,例如也可以是将程序存储到读出专用存储装置、即ROM。]。此外, 通过这些程序的处理所得到的数据等被适当存储在RAM和外部存储装置等, 在提供给其他程序的处理时,从RAM和外部存储装置等读入。更具体地说,信号失真消除装置(1 )的外部存储装置(17 )[或者是ROM等]中存储着用于将反向滤波器应用于观测信号的处理的程序;从将反向滤波器应用于观测信号所得的信号求预测误差滤波器的处理的程序;用于从预测 误差滤波器求反向滤波器的处理的程序;以及这些程序的处理中所需要的数 据(帧单位的观测信号等)。此外还适当保存用于控制基于这些程序的处理的 控制程序。在实施方式1的信号失真消除装置(1)中,存储在外部存储装置(17) [或者是ROM等]的各程序和这些程序的处理所需要的数据根据需要而被读入 RAM ( 15),在DSP ( 14)被解释执行/处理。其结果,通过DSP ( 14)实现 规定的功能(反向滤波器应用部分、预测误差滤波器计算部分、反向滤波器 计算部分、控制部分),从而实现信号失真消除。下面参照图3 ~图5顺序说明信号失真消除装置(1 )中的信号失真消除 处理的流程。大致的处理步骤为(a)求对观测信号x(t)应用反向滤波器的信号(以下, 称为特定信号);(b)从特定信号求预测误差滤波器;(c)从该预测误差滤波器 求反向滤波器;(d)反复所述(a)、 (b)、 (c)的处理而求最优的反向滤波器;(e) 将最优化的反向滤波器对观测信号应用的信号作为复原信号y(t)来得到。(b)相当于所述的a的最优化,(c)相当于所述的g的最优化,(d)相当 于式(17)及式(18)。 (d)的处理的反复次数设为预先决定的次数R"即, 设为l^i^R"此外,(c)的处理中,最优化g的更新规则的更新次数设为预先 决定的次数R2。即,设为l^u£R2 。 (d)的处理,即,在每进行一次(a) 、 (b)、 (c)的一连串的处理,就进行根据更新规则的R2次的更新。实施方式中,次数 Rj殳为预先决定的次数,但并不限定于此,例如也可以在计算出r次的g时 式(26)的Q值和计算出r+l次的g时式(26)的Q值的差的绝对值成为规 定的正的微小值s以下(或者低于s)时终止反复。同样的,次数R2设为预 先决定的次数,但并不限定于此,例如也可以在计算出u次的g时式(26) 的Q值和计算出u+l次的g时式(26)的Q值的差的绝对值成为规定的正的 微小值s以下(或者不到s)时终止反复。 (步骤S100)反向滤波器应用部分(14)根据式(42)将反向滤波器应用于观测信号 X(,[X,(t),…,Xm(t),…,XM(t)]T,从而求特定信号y(t)。特定信号y(t)在计算上与 复原信号完全相同,但这里为了明示并非是经过后述的R,次的处理而求得的复原信号,因而称之为特定信号。这里,t表示所有的样本号,设为lSt^N。N是全样本数。实施方式1中,话筒的个数M可以是1以上。 M 丄W)二 S SU"、(") (42)作为反向滤波器的系数列(gm(k);O^^L),在反复次数Ri的第一次中,使用预先决定的初始值,而在第二次以后则使用由后述的反向滤波器计算部分(13)求得的反向滤波器g^+"。 (步骤SIOI)预测误差滤波器计算部分(15 )由进行分帧处理的分帧处理部分(151 ) 和帧预测误差滤波器计算部分(152)构成。再者,帧预测误差滤波器计算部 分(152)由从第i帧的特定信号求预测误差滤波器的第i帧用预测误差滤波 器计算部分(152i)。但是,i是满足BSF的整数。分帧处理部分(151)将反向滤波器应用部分(14)求得的特定信号 (y(t);lSOO进行分帧处理。例如式(43)所示,分帧处理通过每W点移动 并应用截取W点的窗函数来进行。(yi(n);l^^W)表示i号帧所包含的特定信 号列。j;,(")二少((/ —(43)再者,第i帧用预测误差滤波器计算部分(152i)按照式(22)对第i帧 的特定信号列(力(n);l^^W〉进行P阶的线性预测分析,计算预测误差滤波器 的系数列{*(]<);142}。该计算方法请参照所述参考文献1。这里得到的 a"l),…,a!(P),…,ai(l),…,ai(P),…,aF(l),…,aF(P)供给式(22)的aA(r+1)。 (步骤S102)参照图4说明反向滤波器计算部分(13)的功能结构例。反向滤波器计 算部分(13 )由梯度计算部分(131 )、反向滤波器更新部分(132 )以及更新 用反向滤波器应用部分(133)构成。并且,梯度计算部分(131)构成为包 括具有作为对观测信号的预测误差滤波器应用部分功能的第1预测误差滤 波器应用部分(1311 );具有作为对观测信号应用更新用反向滤波器所得的信 号(更新用反向滤波器应用后的信号)的预测误差滤波器应用部分功能的第 2预测误差滤波器应用部分(1312);以及梯度矢量计算部分(1313 )。这里, 更新用反向滤波器相当于式(27)的g<u>。第1预测误差滤波器应用部分(1311 )将由m号[l^m^M]话筒所观测的观测信号Xm(t)进行分帧,对于各帧,将步骤S101的处理所得的i号预测误差 滤波器a;(k)应用于i号帧的信号Xmi(n)而计算预测误差滤波器应用后的信号vmi(n)(参照式(31))。这里叙述的处理的详细例子将在后述的实施方式3中 说明。第2预测误差滤波器应用部分(1312)将更新用反向滤波器应用后的信 号y(t)进行分帧,对于各帧,将步骤S101的处理所得的i号预测误差滤波器 a乂k)应用于i号帧的信号yi(n)而计算预测误差滤波器应用后的修正估计值 dj(l),…A(W)(参照式(30))。再者,更新用反向滤波器应用后的信号y(t)的 初始值设为由步骤S100的处理所得的信号即可。然后,第2预测误差滤波器 应用部分(1312)输入后述的更新用反向滤波器应用部分(133)输出的更新 用反向滤波器应用后的信号y(t)。这里叙述的处理的详细例子将在后述的实施 方式3中说明。梯度矢量计算部分(1313 )使用信号Vmi(n)和修正估计值di(n),计算当前 的更新用反向滤波器g^的梯度矢量VQg (参照式(28)及式(29))。使用 有限个样本v皿(n)和di(n)运算式(29)时,由样本求期望值E即可。这里叙 述的处理的详细例子将在后述的实施方式3中说明。反向滤波器更新部分(13 2 )以当前的更新用反向滤波器g<u> 、学习率T! (u)、 梯度矢量VQg作为输入,按照式(27)求第u+l次的更新用反向滤波器g<u+1>。 式(27)意味着将求得的8<1]+1>看作新的§<11>来进行更新。更新用反向滤波器应用部分(133)以通过反向滤波器更新部分(132) 所得到的g<u+1>,即新的g,和观测信号x(t)作为输入,按照式(42)求更新 用反向滤波器应用后的信号y(t)。具体来讲,作为式(42)的gm(k),使用由 第u+l次的更新所得到的g进行计算。该计算所得到的更新用反向滤波器应 用后的信号y(t)成为第2预测误差滤波器应用部分(1312)的输入。再者,更 新用反向滤波器应用后的信号y(t)计算上与复原信号是完全相同的,但这里为 了明示并非是经过后述的R,次的处理而求得的复原信号,而是为了进行更新 规则而计算的信号,因而称之为更新用反向滤波器应用后的信号。通过控制部分(600 )的控制进行R2次的更新,作为该结果所得到的g<R2+1> 相当于式(25)的gA(r+1)。上标字符R2是R2。反向滤波器计算部分(13)输 出gA('.+1)。根据控制部分(500 )的控制,每进行一次所述的一连串的处理,r就加1,直到r等于R4,即通过反复R,次所述的一连串的处理(步骤S103)而得 到g"臉"。上标字符R1是R,。该§"(111+1)被设为式(16)的最优解。因此, 在得到§"(111+1)的阶段,反向滤波器应用部分(14)通过按照式(42)将反向 滤波器g""+"应用于观测信号X(t)=[Xl(t),...,xM(t)]T,能够得到复原信号y(t) (步骤S104)。 <实施方式2>实施方式2相当于实施方式1的变形例。具体来讲,是进行§3中叙述的 预白化的方式。因此,对于与实施方式1不同的部分,参照图6和图7附加 说明。再者,预白化是对观测信号进行的预处理,所以这里说明的进行预白 化的方式也可以适用于后述的实施方式3。实施方式2中,信号失真消除装置(1 )的外部存储装置(17 )[或者ROM 等]中还存储着用于求白化滤波器的处理的程序,以及用于进行将白化滤波器 应用于观测信号的处理的程序。实施方式2的信号失真消除装置(1 )中,存储在外部存储装置(17 )[或 者ROM等]的各程序和该各程序的处理所需要的数据根据需要而被读入 RAM ( 15),被DSP ( 14)解释执行/处理。其结果,通过DSP ( 14)实现规 定的功能(反向滤波器应用部分、预测误差滤波器计算部分、反向滤波器计 算部分、白化滤波器计算部分、白化滤波器应用部分),实现消除信号失真。 (步骤S100a)白化滤波器计算部分(11 )根据X阶的线性预测分析来计算用于将各话 筒所得到的观测信号全体(Xm(t);13^^进行白化的滤波器(白化滤波器)的 系数(fm(k);0^k^Q。该计算与线性预测分析相同,请参考所述参考文献1。 白化滤波器的系数成为白化滤波器应用部分(12)的输入。 (步骤S100b)白化滤波器应用部分(12)按照式(39),将所述白化滤波器应用于各话 筒所得到的观测信号而得到白化信号wm(t)。如上所述,式(31 )变更为式(40) 即可,所以在实施方式l中,将根据反向滤波器计算部分(13),特别是第1 预测误差滤波器应用部分(1311)的处理改为根据式(40)的计算处理而不 是根据式(31)的计算处理即可。此外,实施方式1中,将根据反向滤波器 应用部分(14)的处理改为根据式(44)的计算处理而不是根据式(42)的 计算处理即可。步骤S100b的处理之后,进行实施方式1的步骤S100~ S104的处理,但这些处理中,将实施方式1的各处理中的观测信号替换成由步骤 S100b的处理所得到的白化信号而进行与实施方式1相同的处理。在此意义下,在图7中,在表示相当于与实施方式1的步骤S100 S104的各处理的处理的符号上附加了记号'。 M 丄(44)<实施例1〉发明人进行了实施方式2的验证实验,因此表示该实验结果。作为实验 条件,设话筒数量M=4、白化滤波器的阶数X=500、反向滤波器的阶数 L=1000、窗函数的截取样本数(l帧的样本数)\¥=200、预测误差滤波器的 阶数P46、反复次数R尸IO、反向滤波器计算部分的更新次数R2=20。学习 率ri(u),设其初始值为0.05,如果根据式(27)而式(26)的值减少,则通 过将ri(u)的值依次减半,使得式(26)的值必然增大。输入到图6所示的反 向滤波器应用部分(14)的初始反向滤波器设定为如式(45)所示。fl/M A = 200 g",(" = {0 其它 ,"柳《M (45)作为消除信号失真的指标,使用Ds。值(直到对于脉沖响应的全能量的 初期50msec的能量比)评价本发明的实施方式2的效果。从连续发声数据库 取出男女各一名的发声,通过叠加在混响时间为0.5秒的混响室测量的脉冲 响应而合成观测信号。图8表示对于男声及女声将观测信号长度N变为5秒、10秒、20秒、1 分、3分时,反复次数R,(使具有各信号长度N的观测信号执行图6所示的 反向滤波器应用部分(14)、预测误差滤波器计算部分(15)、反向滤波器计 算部分(13)的一轮处理而求反向滤波器的次数)和Dso值的关系。无论是 哪一种情况,增加反复次数则Dso值提高,明显看出反复处理的效果。特别 是即使在观测信号长度为5~ 10秒左右的较短的长度时,也能看出根据反复 处理而使得Ds。值大大提高。此外,通过比较声音频谱来验证了本发明的实施方式2的效果。图9A表示观测信号长度为1分钟时不包含混响的声音(原声音)的声 谙图的摘录,图9B表示观测信号长度为1分钟时包含混响的声音(观测声音) 的声谱图的摘录,图9C表示观测信号长度为1分钟时消除混响后的声音(复原信号)的声谱图的摘录。由图9A和图9C的对比以及图9B和图9C的对 比可知,观测信号所包含的混响被抑制,作为原声音固有的特征的谐波构造 和共振峰构造被恢复。此外,使用LPC频谱失真验证了本发明的实施方式2的效果。图IOB表示原声音的波形,图IOA表示原声音和观测声音的LPC频镨 失真的时间序列(图中的虚线)以及原声音和复原声音的LPC频谱失真的时 间序列(图中的实线)。图IOA和图10B的各横轴表示单位为秒的时间,两 图中使时标一致。图10B的纵轴表示振幅值。但是,只要知道原信号的相对 大小即可,由该意旨而在图10B的纵轴中没有明示其单位。图10A的纵轴表 示LPC频语失真SD ( dB )。由图IOA可知,原声音和复原声音的LPC频谱失真的时间序列(图中的 实线)通常比原声音和观测声音的LPC频谱失真的时间序列(图中的虛线) 还要小。再者,相对于观测信号中LPC频谱失真的平均为5.39 dB、方差为 4.20 dB,而复原声音中平均为2.38dB、方差为2.00dB。此外,由图10A与图10B的对比可知,在原声音和复原声音的LPC频 谱失真的时间序列(图中的实线)表示较大值的区间(例如参照约1.0秒~ 约1.2秒的区间),原声音的波形的振幅值大致为0。实际上,该区间中没有 发声,是无声区间。因此,实际上所感觉的失真相当小。即,可得到以下结 论发声区间中的原声音和复原声音的LPC频语失真的时间序列(图中的实 线)比原声音和观测声音的LPC频谱失真的时间序列(图中的虚线)还要相 当小,因此,能够以高精度复原原声音的频谱。 <实施方式3>实施方式3相当于实施方式1的变形例。具体来讲,是进行§2中叙述的 基于二阶统计量的信号失真消除处理的方式。因此,对于与实施方式l不同 的部分,参照图11和图12附加说明。但是,实施方式3中,设话筒的个数 M为2以上。步骤S100的处理和步骤S101的处理与实施方式1相同。 接着步骤S101的处理,进行步骤S102a的处理。参照图11说明实施方式3的反向滤波器计算部分(13)的功能构成例。 反向滤波器计算部分(13)的构成为具有作为对观测信号的预测误差 滤波器应用部分功能的第1预测误差滤波器应用部分(1311 );具有作为对观测信号应用更新用反向滤波器所得的信号(更新用反向滤波器应用后信号)的预测误差滤波器应用部分功能的第2预测误差滤波器应用部分(1312);梯 度矢量计算部分(1313);反向滤波器更新部分(132);以及更新用反向滤波 器应用部分(133)。这里,更新用反向滤波器相当于式(37)的gm(k)。第1预测误差滤波器应用部分(1311 )将由m号[l^r^M]话筒所观测的观测信号Xm(t)进行分帧,对于各帧,将步骤S101的处理所得的i号预测误差滤波器ai(k)应用于i号帧的信号Xmi(n)而计算预测误差滤波器应用后的信号 vmi(n)(参照式(38))。具体来讲,分帧处理部分(402B)对所输入的观测信号Xm(t)进行分帧处理,输出观测信号Xm(t)的i号帧的信号Xmi(n)。然后,预测误差滤波器应用部分(404i)将信号Xmi(n)作为输入,按照式(38)输出信 号v,4n)。其中,1SSF。第2预测误差滤波器应用部分(1312)将更新用反向滤波器应用后的信 号y(t)进行分帧,对于各帧,将步骤S101的处理所得的i号预测误差滤波器 a,(k)应用于各帧而计算预测误差滤波器应用后的修正估计值d,(l),…,di(W)(参 照式(30))。再者,更新用反向滤波器应用后的信号y(t)的初始值设为由步骤 S100的处理所得的信号即可。具体来讲,除了初始值的情况以外,分帧处理 处理部分(402A)对于后述的更新用反向滤波器应用部分(133)所输出的 更新用反向滤波器应用后的信号y(t)进行分帧处理,将更新用反向滤波器应用 后的信号y(t)进行分帧,输出i号帧的信号yi(n)。然后,预测误差滤波器应用 部分(403i )将信号y《n)作为输入,按照式(30 )输出修正估计值di(l),…,dj(W)。 其中,1S^F。梯度矢量计算部分(1313 )使用信号Vmi(n)和修正估计值d《n),计算当前 的更新用反向滤波器gm(k)的梯度矢量(参照式(37)的右边第二项)。具体 来讲,关于各帧号i (1-£F),相互相关计算部分(405i)计算信号Vmi(n)和 修正估计值d(n)之间的相关〈di(n)v加(n-k)、-,。此外,关于各帧号i ( 1^i^F ), 方差计算部分(406i)求修正估计值di(l),…,di(W)的方差〈di(n)、『,w。关于各 帧号i (1S^F),除法部分(407i)求〈di(n)vmi(n-k)〉一w/〈di(n)2〉『,。加法部 分(407)求除法部分(4071 ) - (407F)在全帧中的总和,即式(37 )的右 边第二项。反向滤波器更新部分(132)以当前的更新用滤波器gm(k)、学习率5、梯 度矢量作为输入,按照式(37)求u+l次的更新用反向滤波器gm(k)'。式(37)意味着将求得的gjk)'看作新的gm(k)来进行更新。更新用反向滤波器应用部分(133)以通过反向滤波器更新部分(132)所得到的gm(k)',即新的gm(k)和观测信号x(t)作为输入,按照式(42)求更 新用反向滤波器应用后的信号y(t)。具体来讲,作为式(42)的gm(k),使用 由u+l次的更新所得到的g进行计算。该计算所得到的更新用反向滤波器应 用后的信号y(t)成为第2预测误差滤波器应用部分(1312)的输入。接着步骤S102a的处理,进行步骤S103和步骤S104的处理,但由于与 实施方式1相同而省略i兌明。 <实施例2>.发明者们进行了实施方式3的验证实验,因此表示该实验结果。作为实 验条件,设M=4、 L=1000、 W=200、 P=16、 R,=6、 R2=50。设定学习率S, 初始值设为0.05,如果I^
Flog〈di(n)V^,w的值增加,则通过将学习率S的值 依次减半,使得2^。og〈di(n)、^w的值必然减小。反向滤波器的初始估计值 设定为gm(k)=0、 l£m^M、 1^k^L。以表示声音清晰度的RASTI (参照参考文献5)作为消除混响的指标来 评价本发明的实施方式3的效果。从连续发声数据库取出男女各五名的发声, 通过叠加在混响时间为0.5秒的混响室测量的脉冲响应而合成观测信号。 (参考文南大5) H. kuttmff. Room acoustics. Elsevier Applied Science, third edition, R23 7 1991.图13是显示了设观测信号长度N为3秒、4秒、5秒、10秒时的RASTI 的值的图。如图13所示,可知即使是观测信号为3~5秒的短时间的情况下, 也显示着较高的混响消除性能。图14是消除混响前后的能量衰减曲线的例子。可知在直接声到达50毫 秒后的反射声的能量减少了 15dB。工业上的可利用性本发明是用于提高各种各样的信号处理系统的性能的基础技术,例如可 利用于语音识别系统、视频会议系统、助听器、音乐信息处理系统等。
权利要求
1、一种信号失真消除装置,消除观测信号的信号失真而得到复原信号,它包括反向滤波器应用单元,在满足了规定的反复终止条件时,将适用于所述观测信号的滤波器(以下,称为反向滤波器)应用于所述观测信号,并将该结果作为所述复原信号输出,在不满足所述反复终止条件时,将所述反向滤波器应用于所述观测信号,并将该结果作为特定信号输出;预测误差滤波器计算单元,将所述特定信号进行分帧,输出对各帧的特定信号进行线性预测分析所得的每个帧的预测误差滤波器;反向滤波器计算单元,求对于所述各帧的特定信号拟合了应用与该帧对应的所述预测误差滤波器所得的各信号(以下,称为修正估计值)的全帧中的修正估计值(以下,称为修正估计值系列)在其全样本间独立的所述反向滤波器,并输出该反向滤波器;以及控制单元,使所述反向滤波器应用单元、所述预测误差滤波器计算单元、所述反向滤波器计算单元反复执行,直到满足所述反复终止条件。
2、 如权利要求1所述的信号失真消除装置,其特征在于, 所述预测误差滤波器计算单元,作为求所述各修正估计值的方差在全帧中的总和最小时的预测误差滤波器,或所述各修正估计值的方差的对数值在 全帧中的总和最小时的预测误差滤波器,对各帧的特定信号进行线性预测分 析,并输出每个帧的所述预测误差滤波器,所述反向滤波器计算单元,将所述修正估计值系列在其全样本间独立的 所述反向滤波器作为全帧中所述各修正估计值的归一化峰值的总和最大时的 反向滤波器而求,并^T出该反向滤波器。
3、 如权利要求1所述的信号失真消除装置,其特征在于, 所述预测误差滤波器计算单元,作为求全帧中所述各修正估计值的方差的总和最小时的预测误差滤波器,或全帧中所述各修正估计值的方差的对数 值的总和最小时的预测误差滤波器,对各帧的特定信号进行线性预测分析, 并输出每个帧的所述预测误差滤波器,所述反向滤波器计算单元,将所述修正估计值系列在其全样本间独立的 所述反向滤波器作为全帧中所述各修正估计值的方差的总和最小时的反向滤波器,或全帧中所述各修正估计值的方差的对数值总和最小时的反向滤波器 而求,并输出该反向滤波器。
4、 一种信号失真消除装置,消除观测信号的信号失真而得到复原信号, 它包括白化滤波器计算单元,输出对所述观测信号进行线性预测分析所得的白 化滤波器;白化滤波器应用单元,将所述白化滤波器应用于所述观测信号而输出白 化信号;反向滤波器应用单元,在满足了规定的反复终止条件时,将适用于所述 白化信号的滤波器(以下,称为反向滤波器)应用于所述白化信号,并将该 结果作为所述复原信号输出,在不满足所述反复终止条件时,将所述反向滤 波器应用于所述白化信号,并将该结果作为特定信号输出;预测误差滤波器计算单元,将所述特定信号进行分帧,输出对各帧的特反向滤波器计算单元,求对于所述各帧的特定信号拟合了应用与该巾贞对 应的所述预测误差滤波器所得的各信号(以下,称为修正估计值)的全帧中 的修正估计值(以下,称为修正估计值系列)在其全样本间独立的所述反向 滤波器,并输出该反向滤波器;以及控制单元,使所述反向滤波器应用单元、所述预测误差滤波器计算单元、 所述反向滤波器计算单元反复执行,直到满足所述反复终止条件。
5、 如权利要求1至权利要求4的任何一项所述的信号失真消除装置,其 特征在于,所述反复终止条件是反复次数为R,次(其中R^是满足R^1的整数)。
6、 如权利要求1至权利要求5的任何一项所述的信号失真消除装置,其 特征在于,所述观测信号是包含信号失真的语音信号。
7、 一种信号失真消除方法,消除观测信号的信号失真而得到复原信号, 它包括反向滤波器应用步骤,在满足了规定的反复终止条件时,反向滤波器应 用单元将适用于所述观测信号的滤波器(以下,称为反向滤波器。)应用于所 述观测信号,并将该结果作为所述复原信号输出,在不满足所述反复终止条件时,反向滤波器应用单元将所述反向滤波器应用于所述观测信号,并将该结果作为特定信号输出;预测误差滤波器计算步骤,预测误差滤波器计算单元将所述特定信号进 行分帧,输出对各帧的特定信号进行线性预测分析所得的每个帧的预测误差 滤波器;反向滤波器计算步骤,反向滤波器计算单元,求对于所述各帧的特定信 号拟合了应用与该帧对应的所述预测误差滤波器所得的各信号(以下,称为 修正估计值)的全帧中的修正估计值(以下,称为修正估计值系列)在其全 样本间独立的所述反向滤波器,并输出该反向滤波器;以及控制步骤,控制单元使所述反向滤波器应用步骤、所述预测误差滤波器 计算步骤、所述反向滤波器计算步骤反复执行,直到满足所述反复终止条件。
8、 如权利要求7所述的信号失真消除方法,其特征在于, 所述预测误差滤波器计算步骤是,作为求全帧中所述各修正估计值的方差的总和最小时的预测误差滤波器,或全帧中所述各修正估计值的方差的对 数值的总和最小时的预测误差滤波器,对各帧的特定信号进行线性预测分析, 输出每个帧的所述预测误差滤波器,所述反向滤波器计算步骤是,将所述修正估计值系列在其全样本间独立 的所述反向滤波器作为全帧中所述各修正估计值的归一化峰值的总和最大时 的反向滤波器而求,并输出该反向滤波器。
9、 如权利要求7所述的信号失真消除方法,其特征在于, 所述预测误差滤波器计算步骤是,作为求全帧中所述各修正估计值的方差的总和最小时的预测误差滤波器,或全帧中所述各修正估计值的方差的对 数值的总和最小时的预测误差滤波器,对各帧的特定信号进行线性预测分析, 并输出每个帧的所述预测误差滤波器,所述反向滤波器计算步骤是,将所述修正估计值系列在其全样本间独立 的所述反向滤波器作为全帧中所述各修正估计值的方差的总和最小时的反向 滤波器,或全帧中所述各修正估计值的方差的对数值的总和最小时的反向滤 波器而求,并输出该反向滤波器。
10、 一种信号失真消除方法,消除观测信号的信号失真而得到复原信号, 它包括白化滤波器计算步骤,白化滤波器计算单元输出对所述观测信号进行线性预测分析所得的白化滤波器;白化滤波器应用步骤,白化滤波器应用单元将所述白化滤波器应用于所述观测信号而输出白化信号;反向滤波器应用步骤,在满足了规定的反复终止条件时,反向滤波器应 用单元将适用于所述白化信号的滤波器(以下,称为反向滤波器)应用于所 述白化信号,并将该结果作为所述复原信号输出,在不满足所述反复终止条 件时,反向滤波器应用单元将所述反向滤波器应用于所述白化信号,并将该结果作为特定信号输出;预测误差滤波器计算步骤,预测误差滤波器计算单元将所述特定信号进 行分帧,输出对各帧的特定信号进行线性预测分析所得的每个帧的预测误差滤波器;反向滤波器计算步骤,反向滤波器计算单元,求对于所述各帧的特定信 号拟合了应用与该帧对应的所述预测误差滤波器所得的各信号(以下,称为 修正估计值)的全顿中的修正估计值(以下,称为修正估计值系列)在其全 样本间独立的所述反向滤波器,并输出该反向滤波器;以及控制步骤,控制单元使所述反向滤波器应用步骤、所述预测误差滤波器 计算步骤、所述反向滤波器计算步骤反复执行,直到满足所述反复终止条件。
11、 如权利要求7至权利要求10的任何一项所述的信号失真消除方法, 其特征在于,所述反复终止条件是反复次数为R,次(其中R^是满足R21的整数)。
12、 如权利要求7至权利要求11的任何一项所述的信号失真消除方法, 其特征在于,所述观测信号是包含信号失真的语音信号。
13、 一种信号失真消除程序,用于使计算机具有权利要求1至权利要求 6的任何一项所述的信号失真消除装置的功能。
14、 一种记录介质,记录了权利要求13所述的信号失真消除程序,且计
全文摘要
本发明的信号失真消除装置包括反向滤波器应用单元,在满足了规定的反复终止条件时,将反向滤波器应用于观测信号的结果作为复原信号输出,在不满足反复终止条件时,将反向滤波器应用于观测信号的结果作为特定信号输出;预测误差滤波器计算单元,将特定信号进行分帧,输出对各帧的特定信号进行线性预测分析所得的每个帧的预测误差滤波器;反向滤波器计算单元,求对于各帧的特定信号拟合了应用与该帧对应的预测误差滤波器所得的各信号(修正估计值)的全帧中的修正估计值在其全样本间独立的反向滤波器并输出;以及控制单元,使反向滤波器应用单元、预测误差滤波器计算单元、反向滤波器计算单元反复执行,直到满足反复终止条件。
文档编号H04R3/00GK101322183SQ20078000043
公开日2008年12月10日 申请日期2007年2月16日 优先权日2006年2月16日
发明者三好正人, 吉冈拓也, 引地孝文 申请人:日本电信电话株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1